「コンピュータビジョン・拡張現実感に関する普通じゃない勉強会」に参加してきました。

  • このエントリーをはてなブックマークに追加
  • 80

と、言う事で、工学ナビの中の人主催の、「コンピュータビジョン・拡張現実感に関する普通じゃない勉強会」に、素人の俺が強行突入してきた。爆破予告の影響で会場変わったときに「所属」を聞かれ、「もしかして俺以外全員学生じゃない?」と思ったら、実際は社会人と学生が5分5分位の割合だった。まぁ、それでも正直、俺の中ではかつてない学生率の高さだったわけが。

で、凄い発表をガンガン聞いた上、当初予定の無かった懇親会が急遽開催され、そこにも勿論突入してきた。そして、会社名刺をバンバン配ってきた。かつて会社名刺を出し渋っていた俺はもういない!プライベートで勉強会に出ても、どんどん会社名刺を出すと決めたのだ!どうせ今までは使わずに無駄になってた名刺だ!!

飲み会では酔って気分が良くなり、かなり暴走気味だった。勿論橋本なおき先生の所にも絡みに行きましたよ。なんと、CD付き名刺と言う荒業で来ていた。あと、橋本さんとその周辺の人は、みんなTENORI-ONだとかアナログシンセだとか持ってきてた。流石だ。

ほら!これが工学ナビの中の人!!顔の方は撮影段階で既に処理済です。

さて、と言う事で発表+飲み会の様子をレポート。前半部分酔って書いてるのでトンでもない内容かもしれないが、やばそうだったら警告求む。後半は次の日書いたので大丈夫・・・なハズ。
なお、今回はカメラを持っていくのをすっかり忘れてしまったので、デモ系の発表だとレポートできる内容が少ない。

大人の科学マガジン別冊 シンセサイザー・クロニクル (Gakken Mook 別冊大人の科学マガジン)

出版社:学習研究社( 2008-07-30 )

定価:¥ 3,456

Amazon価格:¥ 3,456

ムック ( 122 ページ )

ISBN-10 : 4056051836

ISBN-13 : 9784056051834



OpenCV プログラミングブック

著者/訳者:奈良先端科学技術大学院大学 OpenCVプログラミングブック制作チーム

出版社:毎日コミュニケーションズ( 2007-09-22 )

定価:

単行本(ソフトカバー) ( 440 ページ )

ISBN-10 : 483992354X

ISBN-13 : 9784839923549



プログラム表

先頭の画像にある奴だが、パズルみたいな構造になってて面白かった。マーカを載せることも忘れない、さすがARの聖地だと言う印象です。
Flickrに写真をアップしてるがいた。

電脳メガネと実世界はてなスターが実現するデジタルライフスタイル (akio0911)

akio0911氏の発表。
この、神南TVの人・・・かな?
結構有名っぽかったけど、俺は全く知らずに発表に出てきた催しの情報はどこにあるのかと質問してしまった。
内容的には、電脳メガネは出てこない。
2フェーズに分かれた話。

iPhoneを使って、実世界にはてなスターをつける。
iPhone上のアプリをタップすることで、その位置の経度と緯度を含んだURLを生成し、それに対してはてなスターをつけることにより、Googleマップで見ると自分や他の人がはてなスターをつけた場所がわかると言うもの。緯度と経度をURLとして持ったり、Googleマップ上にはてなスターを表示するサーバ部分は、yoshiori氏が作ったらしい。はてなスター一覧APIが無いので、何気に苦労しているとかいないとか。
で、8月10日から選ばれ死10人の戦士が、都内にはてなスターを付けまくっているとの事。
GPSや磁気センサやカメラやEee PCを連携させた装置を載せた自転車を駆って、スターを回収しまくる
8月30日のBarTube@Shibuyaなるイベントで、イベントのたびに24時間自転車で駆け回ってる人が、このスターを回収しまくるとのこと。自転車にくくりつけたカメラで町の様子を中継、さらにGPSやその他センサの力で自分もマップ上に出る
らしい。面白そうなイベントだ。
このガジェットは、小さなタッパーに入っていた。

初音ミクで遊ぶ画像認識/AR (amino)

ニコニコ動画のAR界隈では有名と思われるamino氏。

↑この人。
エー、お前かよ!としか言いようが無い。各動画を見ながらの解説。

電脳コイルの世界はどこまで実現できるか (ksasao)

aminoさん同様、「ニコニコ技術部」の人。ブログはこちら
カメラ画像に絵を重ね合わせ、指が絵に触れた部分は電脳コイルっぽく観賞すると言うデモ+電脳コイルが実現可能かどうかに関する検証。
電脳コイルは2026年の話なので、そろそろ頑張らないといけないと思われる。
デモにより、現状で何とかなりそうな予感も見せつつ、将来的にはコンピュータリソースが現在の1000倍くらいになるので、リソース的には何とかなりそうと言う結論だった。後は、金儲けの美味しい話を作り上げ、金を出させることが重要ではないかと言う事。その通りだ。
質問で、実世界をテクスチャとして保存するには陰影が異なるものとか、環境によって色々変わるから、要領が爆発するのでは?と言うものがあった。個人的意見としては、「そんな陰影とか必要ないだろ。」と思ったが。

あと、懇親会で喋った人が、「1000倍は絶対ムリだ!」と力説していた。どうも、1000倍のコンピュータを動かすために必要なエネルギーを確保するのが困難とかそんな話だった。すごい理論的だったが、難しい用語とかが出てきてちょっと覚え切れなかった。でも凄い内容だったので、第2回の勉強会で発表するよう、橋本さんにアピールしといた。

ちなみに、akio0911さんの話に出てきた、自転車に乗っけるデバイスも登場。思ったより小さかった。
で、方向と傾きを検出し、特定の方向にはちゅねミクがいて、それを探すと言うデモを見せてくれた。

電脳コイルの世界実現に欠かせないハードウェアについてのサーベイ (arc@dmz)

HMDとか、要するに電脳メガネっぽい実在デバイスの変遷についての話。網膜にレーザを当てるとか言う、最近ニュースとかに出た奴が、網膜上に高速移動でレーザを出してるらしく、壊れて移動が止まったら失明するかもと聞いて引いた。ホログラム式頑張れ。
あと、近々digitalmuseumでFTIR方式のマルチタッチスクリーンのJavaドライバを公開するとか。

シニアマーケットに向けた遺跡復元ARコンテンツ:バーチャル飛鳥京 (ktx)

バーチャル飛鳥京」の紹介。
で、バーチャルな飛鳥京のモデルをリアルにするために、陰影をつけるための工夫の話。詳しくはこちら
しかし、ここまでリアルになっちゃうとこのバーチャルメガネ掛けて歩き回れない気がする。絶対実物とバーチャル間違えてつまずく。後、シニア向けといってたけど、あのHMDがメガネの上から掛けられるのか?それが問題だ。
質疑応答の流れで、入力デバイスを何にすべきかと言う話になり、それ系の会社の人が次々とカミングアウトして議論していた。それによると、やはりケータイの画面は小さくて見づらいという意見のようだ。

また、8月17日まで新宿ICCで「リアルタイム映像配信 《遠隔 妖怪にらめっこ》」と言うイベントをしているとの事。

CV、AR、VRのとりこになるためのいくつかのステップ (masayashi)

元は「?10の方法」だったが変わっていた。10個見つからなかったんだ。
取り敢えず、俺にとっては最も大事と言って差し支えの無い話だから、真面目に聞いてみた。
「動機は不純な方がいい」という名言を残した。あと、作ったものは発表してフィードバックを得ろ、そして開発へのスパイラルだ!とか、色々イベントに行くべきだ、との事。
また、「基礎を学ぶための、具体的な方法は?」の質問に対する、橋本なおきさんの「自分のブログに良い基礎本があるので、アフィリエイトに貢献するように」も重要。確かに九州から来てくださった人なのだから、それくらいはすべきだろう。

gainerを用いたディスプレイとのインタラクション (dandelion)

OpenCVプログラミングブックの著者の一人で、今回はGAINERとWiiリモートを使ったシステムの紹介。ソフトウェア部分をC++で実装したらしいが、GAINERは元々AS3やProcessingなど、敷居の低い言語での普及を目指しており、C++で実装するのは逆行では?という意見が、重鎮ぽい人から出ていた。でも、自分のなれた言語に瞬時に移植できると言う敷居の低さは凄いなと、俺としては改めて感心した。
しかし、やはりGAINERは注目度が高いんだなぁと実感する。俺もそろそろ買う日が来るのか?

あと、マルチタッチスクリーンを作っていますという報告。方式名は忘れてしまったorz

WebカメラとOpenCVで実現する微速度撮影 (hiro)

「微速度撮影」をテーマにした、OpenCVの基礎講座。結構細かいコードのTipsなど。OpenCV初心者の俺にとってはかなり助けになった。まず、OpenCVが何をするものなのかがわかったし。非常にためになった。OpenCV試そう。と言う感想が残った。
出てきたTipsはこんな感じ。

  • includeだけでなく、pragma commentも入れておくと良いらしい
    1. #pragma comment(lib,"cv.lib")
    2. #pragma comment(lib,"cxcore.lib")
    3. #pragma comment(lib,"highgui.lib")
  • OpenCVのキャプチャ処理は重いので、(今回はOpenCVだけでやると言う発表なので使うが、)本来は別の方法を使うべき。
    1. cvCaptureFromCAM(-1)
  • aviファイルへの出力は、CvVideoWriterを使用する。
    1. CvVideoWriter* writer = NULL;
    2. ・・・
    3. writer = cvCreateVideoWriter(・・・);
  • 処理時間の計測には、cvGetTickCount関数を使う。
  • 微速度撮影のための「加重平均」によって圧縮したフレームはcvAddWeighted関数を使って作る。
  • 加重平均して作った映像は全体的に動いてる物体がぼけてて、コンピュータで解析処理には不向き→微速度撮影映像を作る時に処理する

ARToolKitプログラミングがより面白くなる禁断のテクニック (橋本なおき)

OpenCVとARToolKitを連携させる方法や、メタセコでモデリング方法を工夫して穴ぼこを表現する方法などについて。
メタセコイアで透明な壁を作り、穴を表現して、それに実際にモデルを落とす様子をデモしていた。

メタセコイアで作った穴ぼこを真似てみた。穴の壁は内向きのポリゴンで、周辺は透明な壁

ちなみに、この穴ぼこ真似モデルは、Spark ProjectFLARToolKit/samples/model/hole.mqoとしてコミットしておいた。

連携方法に関してはコードを示しての詳細な解説だった。方法は、9月18日にARToolKitの本を出されるそうなので、それを期待しながら待てばよい。
これだ。

3Dキャラクターが現実世界に誕生! ARToolKit拡張現実感プログラミング入門

著者/訳者:橋本 直

出版社:アスキー・メディアワークス( 2008-09-17 )

定価:

Amazon価格:¥ 7,895

大型本 ( 240 ページ )

ISBN-10 : 4048673610

ISBN-13 : 9784048673617


取り敢えず簡単に書くと、OpenCVはBGR、ARToolKitはBGRAで画像を表現するので、まずcvLoadImageで画像を読み込んだら、cvCvtColorに、BGR2BGRA引数を与えて呼び出し、画像形式を変換。そしたら、変換後の画像(IplImage型)のimageDataメンバが、ARUint8*型にキャスト出来るので、それをARToolKitで使うと言う事のようだ。

メガデモ的トリックを動画像処理に応用する (福地健太郎)

EffecTVを開発された方による、開発時の工夫の話。EffecTVはWebカメラの映像にリアルタイムにエフェクトをかけると言うアプリで、初めて作成されたのが1995年、当時は今のようにリソースをゴリゴリ使える富豪プログラミングの時代ではなかったので、様々な工夫により、「いかにそれっぽく見せるか」が重要だったとの事。この、「凄そうに見せかける」事の重要性を、実際にそれで成功してきた人から聞くと成る程と思える。
また、楽しみ方を、利用者が決める事の出来るモノを作ると言うのが参考になった。EffecTVはカメラ映像に連動しているため、例えば音楽に合わせて踊る場合、踊っている人をカメラで映せば、ソフトウェアから何もしなくても、勝手にリズムに合わせた映像が作られる。この、「人がやってくれることをうまく使う」と言う点が流石。
また、実際にEffecTVの内、Cameleon EffectとQuarkについて、コードを見ながら解説してくださった。このコード内でも、小数の計算がなくなるようにしたり、細かい数値を適当に整数で定義しなおしたりと工夫しているらしい。

それから、作った作品の見せ方に関する注意点。

  • 萌えは最後の武器、ニコニコ動画以外(特に海外)がターゲットなら、萌え以外のデモを用意すること
  • 最低限英語の情報を用意すること

俺も早速やらねば。

当日持ち込み企画その1.液晶テーブルトップによる、透明マーカの実現

「Enhanced Desk(pdf形式論文)」なる物を製作された人らしい。
今回は、透明なマーカに関する話。偏光シートと光学フィルムを使って、液晶の光を上手く遮り、人間が見ると透明な板だが、カメラに映すとARマーカになると言う、あっと驚くようなデモ動画を紹介して下さった。懇親会で聞いた話だと、それ自体は結構昔からあるアイデアだったらしい。AR業界は奥が深い。
でも、この方式なら今のケータイのカメラにも簡単に偏光シートを付け、光学フィルムを映して実現出来そうだ。

当日持ち込み企画その2. (河野恭之)

そう、大学教授です。
今回の勉強会の特徴はまさにこれ。大学教授が来ている。しかも複数。
こちらの方は、「講義でニコニコ動画の映像を使い、生徒に噂された」らしい。
赤外線カメラで映すと見える特殊な塗料を使い、人間の目には見えないARマーカを作成するという話。「ObjectCam2:環境に対するロバスト性を増した把持物体抽出カメラ 」この解説にあるどーも君の写真が出てきたので、多分これなんじゃないかな?
不可視マーカは結構色んな方法が模索されてるみたいです。また、透明マーカについて懇親会で話を色々聞くと、やはり実際問題として商品にARマーカが付いてるのはちょっと微妙と言うのも、共通認識としてあるようだ。

持ち込み企画その3. (momo_dev)

momo_devさんによる、「ネットタンサー」なるロボットのデモ。
このロボは凄い。データを取れたり、プログラムを組めたりとギーク垂涎のおもちゃで、なぜこれの存在を俺は知らなかったのかと後悔した。で、すぐ買おうかと思ったが50000円は高かったので止めた。しかも売り切れ中だと言ってたし。

発表内容は、ロボの機能の一つ、カメラ映像のPC側での受信によって得た画像を、OpenCVによって顔認識し、人の顔の方を向くロボットを実現したと言うデモ。実際にロボが出て来て、顔を認識して向いていた。凄かった。ロボ動いてたし。
が、懇親会&帰宅時にksasaoさん(ネットタンサー持ってる)に聞いた所によると、このロボは既に自前の認識システムを持ってるらしい。しかも高精度との事。それもデモして欲しかった。

持ち込み企画その4.


この動画にある、阿佐ヶ谷の七夕祭りの様子。ミクやポニョといった各種アニメのキャラが吊るされていた。何でも、版権の方はごにょごにょらしい。

懇親会

急遽決まった懇親会。よく場所取れたな。サイトウサンTシャツで有名なあの人が場所取り&幹事をしてくれていたようだ。お疲れ様です。
懇親会は凄く楽しかった。
橋本なおきさんが持ってきていたTENORI-ONに触らせてもらったり、レアアイテム「サイトウサン名刺」をゲットした。あと、色んな所から人が来てたのがわかって楽しかった。こんな楽しい名刺交換はそうそう無いな。学生の人も結構名刺を作ってきてたが、流石ARだけあって、名刺が既にマーカと言う夢のアイデアを実現させてる人がいた。でもサイトのURLが無かった。惜しいぜ!

取り敢えず橋本大先生に絡んで、「俺のサイトへのリンク張ってくださいよ?」とゴリ押ししといた。

以下、懇親会で出ていた真面目な意見(うろ覚え)

  • ARマーカは見た目がダサいので、何とかしなくちゃ駄目
  • 現在の1000倍の能力を持つコンピュータを動かせるようなエネルギーは、絶対確保できないので、現状で何とかすべき。そうすれば電脳コイルの頃には枯れた技術になってるしいい筈。
  • ARは、技術的には面白いが、で、それでどうやって儲けるの?と言われると言葉に詰まる。これはアカデミック側の人も、企業側の人も言ってた
  • モデルの表現能力をアップするためにも、次回はMikuMikuDanceの人を巻き込みたい。
  • yuisekiさんは実在する。

何にせよ、色々な方と色々喋って、非常にモチベーションが上がった。何かを作るためにこの盆休みを全て使っても全く問題ない。まずは、何を作るかを今日中に決めねば!

スポンサーリンク
スポンサーリンク
  • このエントリーをはてなブックマークに追加

フォローする

スポンサーリンク
スポンサーリンク