研究課題
本研究課題の目標は、音響信号処理から対話モデルまで、音声言語理解における各処理層の統計的性質を明らかにし、それらを密統合することで高度で柔軟な統合的音声対話システムを実現することである。最終年度であるH25年度は、前年度までの成果をもとに実際のタスクを想定した実験評価を行うとともに、統合の基盤となる音声対話ツールキットの構築・拡張、さらに音声インタフェースへの応用について検証を行った。(統合システム)音声対話システム構築ツールキットMMDAgentのアーキテクチャを様々な情報を扱えるよう改善した。また、腕時計型スマートデバイスの検討を行った。(対話エージェント)システムの適応の一つとして、性別や年齢層に応じて対話対象のエージェントを切り替えることで対話が活性化することを検証した。また音声入力を用いるUIデザインの指針をユーザビリティ評価により検討した。(対話管理)ターンテイキングの誤り修復について、昨年度開発した提案手法をMMDAgentのプラグインとして実装し,デモシステムを構築した.さらに機械学習によりそのような修復が必要か否かを高精度に判別する手法を開発した.(音声認識)多層の制約を音声認識に直接組み入れるベイズリスク最小化探索を音声認識エンジンJuliusへ組み込み、層間の統合の基盤を構築した。また、複数認識結果の統合および各単語の誤りリスク自動決定法について研究し、音声ドキュメント検索システムにおいて評価を行った。(音声モデル)ニューラルネットワークを用いた音声モデルについてメモリ量や計算量を削減する手法に取り組み、それらの削減量と認識精度の関係を明らかにした。(言語モデル)対話のコンテキストや話題に適合した言語モデルを構築することを目標としてモデル選択および少量テキストによる自動適応の枠組みを検討した.研究成果の一部は論文およびソフトウェアとして公開されている。
25年度が最終年度であるため、記入しない。
すべて 2014 2013
すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (15件) (うち招待講演 3件)
電子情報通信学会論文誌
巻: Vol.J96-D, No.10 ページ: 2530-2539
情報処理学会論文誌
巻: Vol.54, No.7 ページ: 1967-1977