2003 Fiscal Year Annual Research Report
Project/Area Number |
01F00747
|
Research Institution | The University of Tokyo |
Principal Investigator |
石川 正俊 東京大学, 大学院・情報理工学系研究科, 教授
|
Co-Investigator(Kenkyū-buntansha) |
PERRIN Stephane Matthieu 東京大学, 大学院・情報理工学系研究科, 外国人特別研究員
|
Keywords | センサフュージョン / ジェスチャー認識 / 音声認識 / 隠れマルコフモデル |
Research Abstract |
人間は,視覚,聴覚などの複数の感覚をうまく統合することによって優れた認識能力を実現している.このような優れた能力を工学的に実現するための技術がセンサフュージョンである.当該研究員は,センサフュージョンの技術をヒューマンインタフェースに応用するための研究を行っている.具体的には,ビジョンとマイクロフォンを用いて人間の動作や声を計測し,それらの情報を融合することで,人間のジェスチャーの認識を高速かつ高い精度で実現することを目標としている.聴覚と視覚情報の融合は,これまでにも多くの研究が行われてきたが,それらのほとんどは,人間の話し声に対する音声認識を目的としたものであった.一方,人間のジェスチャー認識に聴覚と視覚のセンサフュージョンを応用した研究はなく,本研究はジェスチャー認識に対して,新たな視点から取り組み,性能の向上を目指すものである.本年度は次のような研究を行った. (1)ヒューマンインタフェースのためのジェスチャーと音声の統合 隠れマルコフモデルによる音声認識手法を,ジェスチャーの認識へ拡張し,新たなジェスチャー認識手法を提案した.また,音声とジェスチャーのそれぞれの認識結果の統合手法について提案した.高速ビジョンを用いて1msで人間の手の動きを計測し,提案した隠れマルコフモデルによるジェスチャー認識の実験を行い,その有効性を確かめた. (2)レーザーポインタを用いた実時間トラッキングシステムの開発 指によるジェスチャー入力を高速に実現するために,レーザーポインタを用いた実時間トラッキングシステムを開発した.開発したトラッキングシステムは,レーザービームとフォトディテクタ,2つの回転ミラーからなる.人間の手指に対して能動的にレーザーを当て,その光点をトラッキングする.レーザーを用いているため,外界の明るさに関係なくトラッキングできる.また,回転ミラーを用いで2自由度のトラッキング機構を構成しているために,全体のシステムも小型化することができた.開発したトラッキングシステムを,ジェスチャーによる空間文字入力に用いて,その有効性を確かめた.
|
-
[Publications] S.PERRIN, M.ISHIKAWA: "Quantized Features For Gesture Recognition Using High Speed Vision Camera"Proc. of Brazilian Symposium on Computer Graphics and Image Processing (SIBGRAPI 2003). 383-390 (2003)
-
[Publications] S.PERRIN, A.CASSINELLI, M.ISHIKAWA: "Laser-Based Finer Tracking System Suitable for MOEMS Integration"Image and Vision Computing New Zealand 2003 (IVCNZ 2003). 131-136 (2003)
-
[Publications] S.PERRIN, A.CASSINELLI, M.ISHIKAWA: "Gesture Recognition Using Laser-based Tracking System"6th International Conference on Automatic Face and Gesture Recognition 2004 (FG 2004). 17-19 (2004)