研究課題
本研究課題の目的は、音声言語理解において、信号処理から意味理解、ユーザモデルまでの各層の実際的な関係や統計的性質を明らかにし、それに基づいて処理を確率的に密統合することで、より高度かつ柔軟な音声言語処理と、高度な音声言語インタフェースを実現することである。H21年度は、研究計画の初年度として、主に各層における研究および確率的な制約表現方法、他層との接続可能性について研究を行った。1、制約条件の調査では、全メンバーによる集中的な研究ミーティングを8月と12月に開催し、各階層の内部仕様および外部仕様、今後の方向性とターゲットについて討議を行った。2、言語モデルについては、国会音声や講演といった自然発話の自動書き起こしの研究において得られた、認識結果の可読性、状況・話題といった知識を探索過程へ動的な組み込む方について検討した。また幅広いタスクにおける言語モデルの話題依存性についても調査した。3、ベイズリスク最少化深索においては、最小化探索において組み込む外部制約の高精度化のために、単語重要度推定や認識誤りのシミュレーションを提案し検証した。4、音響モデルについては、日本語話し言葉コーパス(CSJ)の音響モデルの異なるタスクに対する頑健性を調べ、タスクと音響モデルの関連性について調査した。5、データ収集用音声対話システムについては、大規模で広いインタラクティブなデータ収集のために、Webベースの音声入力アプリケーションの開発と改善を行った。6、統計的ユーザモデル及び統計的対話モデルについては、ユーザの発話履歴や想定文パターン(文法)とのマッチ度合いを応答候補選択に反映させる手法、ならびに統計的な対話管理手法として近年注目されているPOMDP(Partially observable Markov decision process)に基づく音声対話システムについて研究を行った。
すべて 2010 2009
すべて 学会発表 (14件)