研究課題
本研究課題の目的は、音声言語理解において、信号処理から意味理解、ユーザモデルまでの各層の実際的な関係や統計的性質を明らかにし、それに基づいて処理を確率的に密統合することで、より高度かつ柔軟な音声言語処理と、高度な音声言語インタフェースを実現することである。H22年度は、初年度の成果をもとに、各層における確率的な制約表現方法、ならびに他層との接続に関する研究を遂行した。1)制約条件の調査では、昨年度の討議をもとに、各層ごとのモデルユニットについて討議を行った。また、言語情報と認識処理の融合の一つとして、辞書情報に基づいて認識結果を早期確定する手法を検証・評価した。2)言語モデルについては、言語・発音モデルの統計的変換手法を探索過程へ動的に組み込む方法について検討した。また言語モデルの話題依存性、タスク適応、効率的なワードスポッティング手法についても研究した。3)ベイズリスク最少化深索においては、音声認識エンジンJuliusへ手法の組み込みを行い、それに基づく情報検索システムを試作して評価を行った。4)音響モデルについては、多様な話者層や言語に対応する音声認識システムの構築を通じて音響モデルの多様性を検証するとともに、様々な特徴量やモデルパラメータの動的な制御について調査した。5)データ収集用音声対話システムについては、音声対話システムを用いた自然な対話発声データの大規模収集のためのシステムの開発と改善を行っており、プロトタイプを完成させつつある。6)統計的ユーザモデル及び統計的対話モデルについては、対話制御の効率的な統計的モデル化の検討を行うとともに、目標である他層情報との密結合の試行として、発語行為(音声の発話タイミング)を対話制御に直接反映させてモデル化する手法を検討し、評価した。
すべて 2011 2010
すべて 雑誌論文 (6件) (うち査読あり 2件) 学会発表 (11件)
IEEE Trans.Audio, Speech & Language Process.
巻: 18(6) ページ: 1539-1549
Proc.Asia-Pacific Signal and Information Processing Association(APSIPA)
巻: 1 ページ: 82-85
情報処理学会研究報告
巻: 2010-SLP-82(19) ページ: 1-6
人工知能学会研究会資料
巻: SIG-SLUD-B002-12 ページ: 53-58
電子情報通信学会技術研究報告
巻: 110 ページ: 77-82
巻: 110 ページ: 25-30