2008 Fiscal Year Annual Research Report
発声を伴った頭部ジェスチャーの認識手法と電動車いすなどの制御インタフェースの開発
Project/Area Number |
20700471
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
佐宗 晃 National Institute of Advanced Industrial Science and Technology, 情報技術研究部門, 研究員 (50318169)
|
Keywords | 福祉支援技術 / 自立支援技術 / マイクロフォンアレイ / 音源定位 / 電動車いす / ポインティングデバイス |
Research Abstract |
手の不自由な方を対象として、発声時の頭部方向(発声位置)で様々な機器の制御を可能にするインタフェースの開発を行っている。H20年度は、2次元音源定位を用いて「前進」「右折」「左折」「停止」の操作が可能な電動車いすの開発を行った。より多様な操作を実現するために、3次元音源定位を実現する3軸マイクロフォンアレイの開発も行った。実用的なシステムであるためには、様々な背景雑音が干渉する場合でも、発声位置を正しく定位できなければならない。このために、周囲の雑音レベルを自動的に学習し、そのレベルに対して優位な周波数成分を選択することで、雑音に対する頑健性を高めた。現在のシステムでは、発声位置から頭部方向を推定しているが、その発声位置から音声がどの方向にどれだけの強度で放射されているかを表す放射特性も考慮することで、より頑健な頭部方向推定が可能になる。本年度は、その基礎研究として、頭部が入る程度の16角形のフレームに、中心から放射状に直線マイクアレイを設置したマイクスタンドを作成し、その中心で実際に発声した音声を収録して、放射特性の測定を行った。そして、音圧の測定点間を線形補間することで、任意の場所における音圧を近似する放射特性モデルを構築した。また、電動車いす以外に、ポインティングデバイスの開発も行った。従来、コンピュータへの入力デバイスとしてキーボードやマウスなどが代表的であるが、いずれも手による操作が必要であるため、手に不自由がある方の障害となっている。本年度、3軸マイクロフォンアレイを用いた音声ポインティングデバイスの開発も行い、カーソルの上下左右方向への移動に加え、ディスプレイからの距離に基づいた画面の局所領域のズーム機能を実現した。更に、発声を伴った頭部ジェスチャーの認識アルゴリズムを開発し、10種類の頭部ジェスチャーを約90%の精度で認識できることを確認した。
|