研究概要 |
本研究で解決すべき課題は、異なる性質を持つ複数の音声入力検知機構や無効入力棄却判定を統合することで、実環境においてユーザの意図する入力音声のみを受理するアルゴリズムを構築することである。この成果をまとめることにより、最終的には, 入力開始を意識しない「スイッチフリー」な音声言語インタフェースを実現する。最終的な目標としては、ユーザの入力音声のみを確実に取り出せる。自然で信頼感のあるスイッチフリーな実環境向け音声認識システムの構築を目指す。これらの研究計画にしたがい、平成20年度は、昨年度までの基礎アルゴリズムの検討結果を受けて、不要音・不要発話の棄却アルゴリズムの実装と実際の音声対話システム上における動作実験、研究成果の整理と公開などを行った。またこのアルゴリズムを応用した自然な音声認識インタフェースのさらなる可能性について検討した。具体的な内容は以下の通りである。 1. 音声認識ソフトウェアJuliusにおけるGMMに基づく実時間音声区間検出を日常環境で実践するとともに、ロボット組み込みなど特定環境への応用を図った。これは企業との音声対話ロボットに関する共同研究に繋がった。 2. 昨年度、大学で設置した学内案内用音声対話システムの知見を活かし、マイコン向け音声認識ソフトウェアにおいて回機能を実装した質問応答システムの開発を行った。 3. 本研究成果を広く公開すべく、音声認識ソフトウェアJuliusに実装するとともに、応用を促進する目的でAPIや開発環境を整備した。また、その成果を論文として学会誌に寄稿した。 4. 本研究で開発した手法を発展させた新たな研究課題として、認識中の仮説候補のスコア状態からその確定を判断し、「しゃべり終わる前に認識する」研究の検討を開始し、その予備的結果を電子情報通信学会音声研究会にて発表した。
|