2013 Fiscal Year Annual Research Report
多層モデルの階層間密統合に基づく音声理解フレームワークの研究
Project/Area Number |
21300066
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
李 晃伸 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (80332766)
|
Co-Investigator(Kenkyū-buntansha) |
西村 竜一 和歌山大学, システム工学部, 助教 (00379611)
駒谷 和範 名古屋大学, 工学(系)研究科(研究院), 准教授 (40362579)
南條 浩輝 龍谷大学, 理工学部, 助教 (50388162)
西田 昌史 同志社大学, 理工学部, 准教授 (80361442)
篠崎 隆宏 東京工業大学, 総合理工学研究科(研究院), 准教授 (80447903)
秋田 祐哉 京都大学, 学内共同利用施設等, 助教 (90402742)
|
Project Period (FY) |
2009-04-01 – 2014-03-31
|
Keywords | 音声言語処理 / 音声認識 / 音声対話 / 言語モデル / 対話エージェント |
Research Abstract |
本研究課題の目標は、音響信号処理から対話モデルまで、音声言語理解における各処理層の統計的性質を明らかにし、それらを密統合することで高度で柔軟な統合的音声対話システムを実現することである。最終年度であるH25年度は、前年度までの成果をもとに実際のタスクを想定した実験評価を行うとともに、統合の基盤となる音声対話ツールキットの構築・拡張、さらに音声インタフェースへの応用について検証を行った。(統合システム)音声対話システム構築ツールキットMMDAgentのアーキテクチャを様々な情報を扱えるよう改善した。また、腕時計型スマートデバイスの検討を行った。(対話エージェント)システムの適応の一つとして、性別や年齢層に応じて対話対象のエージェントを切り替えることで対話が活性化することを検証した。また音声入力を用いるUIデザインの指針をユーザビリティ評価により検討した。(対話管理)ターンテイキングの誤り修復について、昨年度開発した提案手法をMMDAgentのプラグインとして実装し,デモシステムを構築した.さらに機械学習によりそのような修復が必要か否かを高精度に判別する手法を開発した.(音声認識)多層の制約を音声認識に直接組み入れるベイズリスク最小化探索を音声認識エンジンJuliusへ組み込み、層間の統合の基盤を構築した。また、複数認識結果の統合および各単語の誤りリスク自動決定法について研究し、音声ドキュメント検索システムにおいて評価を行った。(音声モデル)ニューラルネットワークを用いた音声モデルについてメモリ量や計算量を削減する手法に取り組み、それらの削減量と認識精度の関係を明らかにした。(言語モデル)対話のコンテキストや話題に適合した言語モデルを構築することを目標としてモデル選択および少量テキストによる自動適応の枠組みを検討した.研究成果の一部は論文およびソフトウェアとして公開されている。
|
Current Status of Research Progress |
Reason
25年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
25年度が最終年度であるため、記入しない。
|
Research Products
(17 results)