研究概要 |
人間は,視覚,聴覚などの複数の感覚をうまく統合することによって優れた認識能力を実現している.このような優れた能力を工学的に実現するための技術がセンサフュージョンである.当該研究員は,センサフュージョンの技術をヒューマンインタフェースに応用するための研究を行っている.具体的には,ビジョンとマイクロフォンを用いて人間の動作や声を計測し,それらの情報を融合することで,人間のジェスチャーの認識を高速かつ高い精度で実現することを目標としている.聴覚と視覚情報の融合は,これまでにも多くの研究が行われてきたが,それらのほとんどは,人間の話し声に対する音声認識を目的としたものであった.一方,人間のジェスチャー認識に聴覚と視覚のセンサフュージョンを応用した研究はなく,本研究はジェスチャー認識に対して,新たな視点から取り組み,性能の向上を目指すものである.本年度は次のような研究を行った. (1)ヒューマンインタフェースのためのジェスチャーと音声の統合 隠れマルコフモデルによる音声認識手法を,ジェスチャーの認識へ拡張し,新たなジェスチャー認識手法を提案した.また,音声とジェスチャーのそれぞれの認識結果の統合手法について提案した.高速ビジョンを用いて1msで人間の手の動きを計測し,提案した隠れマルコフモデルによるジェスチャー認識の実験を行い,その有効性を確かめた. (2)レーザーポインタを用いた実時間トラッキングシステムの開発 指によるジェスチャー入力を高速に実現するために,レーザーポインタを用いた実時間トラッキングシステムを開発した.開発したトラッキングシステムは,レーザービームとフォトディテクタ,2つの回転ミラーからなる.人間の手指に対して能動的にレーザーを当て,その光点をトラッキングする.レーザーを用いているため,外界の明るさに関係なくトラッキングできる.また,回転ミラーを用いで2自由度のトラッキング機構を構成しているために,全体のシステムも小型化することができた.開発したトラッキングシステムを,ジェスチャーによる空間文字入力に用いて,その有効性を確かめた.
|