2010 Fiscal Year Annual Research Report
口唇動作を用いた多言語間の非発声ヒューマンインタフェースの研究
Project/Area Number |
22500112
|
Research Institution | Tokai University |
Principal Investigator |
山田 光穗 東海大学, 情報通信学部, 教授 (60366086)
|
Keywords | 口唇検出 / 口唇動作履歴 / パワースペクトル / 日本語母音認識 / 英語母音認識 / ヒューマンインタフェース / 音声認識 / 発話訓練 |
Research Abstract |
本研究の目的は口唇動作を用いた非発声によるヒューマンインタフェースを、複数の言語間でシームレスに実現し、国際化、ボーダレス化の著しい各種装置のユーザーインタフェースの向上に貢献しようとするものである。本年度は、口唇特徴点抽出・母音検出装置の開発と単語認識アルゴリズムの開発がテーマである。 まず、口唇特徴点抽出・母音検出装置について研究実績を述べる。性別、年齢層など様々な被験者の発話時の口唇動作を撮影し、照明条件や話者によらず安定して母音を検出できるアルゴリズムを検討した。この結果を用いて、顔画像から眼球位置を元に口唇部の抽出を行い、口唇動作の特徴点を高精度で確実に抽出できる入力装置を開発した。 次に単語認識アルゴリズムの研究成果について述べる。まず語数が同じで発話時間では認識が困難な百人一首上の句を用いて分析を行い、各特徴点の口唇動作履歴パワースペクトルを比較することにより、完全に母音が一致する句間を除いて、単語認識が可能なことを示した。次に実用的な例として、駅名認識に取り組み、語数別に分けることにより、大手私鉄一路線内の駅名を認識できることを示した。総当たり的にすべての駅名間の認識率を調査するのは現実的でなく、母音の組み合わせ別に合理的に駅名を整理し認識できる新たなアルゴリズムについて引き続き検討を行っている。英語については、24種類あると言われているイギリス英母音を対象として分析を行い、口唇動作履歴パワースペクトルにより識別できる可能性を明らかにした。同時に、イギリス英母音に限定しても、出身等によりかなりの個人差があることが分かり、より多くの被験者の口唇データを取得して、解析を続けている。
|
Research Products
(5 results)