2010 Fiscal Year Annual Research Report
多層モデルの階層間密統合に基づく音声理解フレームワークの研究
Project/Area Number |
21300066
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
李 晃伸 名古屋工業大学, 大学院・工学研究科, 准教授 (80332766)
|
Co-Investigator(Kenkyū-buntansha) |
秋田 祐哉 京都大学, 学術情報メディアセンター, 助教 (90402742)
駒谷 和範 名古屋大学, 工学研究科, 准助教 (40362579)
西村 竜一 和歌山大学, システム工学部, 助教 (00379611)
篠崎 隆宏 千葉大学, 融合科学研究科, 助教 (80447903)
西田 昌史 同志社大学, 理工学部, 准助教 (80361442)
南條 浩輝 龍谷大学, 理工学部, 助教 (50388162)
|
Keywords | 音声言語理解 / 音声対話 / 音声認識 |
Research Abstract |
本研究課題の目的は、音声言語理解において、信号処理から意味理解、ユーザモデルまでの各層の実際的な関係や統計的性質を明らかにし、それに基づいて処理を確率的に密統合することで、より高度かつ柔軟な音声言語処理と、高度な音声言語インタフェースを実現することである。 H22年度は、初年度の成果をもとに、各層における確率的な制約表現方法、ならびに他層との接続に関する研究を遂行した。1)制約条件の調査では、昨年度の討議をもとに、各層ごとのモデルユニットについて討議を行った。また、言語情報と認識処理の融合の一つとして、辞書情報に基づいて認識結果を早期確定する手法を検証・評価した。2)言語モデルについては、言語・発音モデルの統計的変換手法を探索過程へ動的に組み込む方法について検討した。また言語モデルの話題依存性、タスク適応、効率的なワードスポッティング手法についても研究した。3)ベイズリスク最少化深索においては、音声認識エンジンJuliusへ手法の組み込みを行い、それに基づく情報検索システムを試作して評価を行った。4)音響モデルについては、多様な話者層や言語に対応する音声認識システムの構築を通じて音響モデルの多様性を検証するとともに、様々な特徴量やモデルパラメータの動的な制御について調査した。5)データ収集用音声対話システムについては、音声対話システムを用いた自然な対話発声データの大規模収集のためのシステムの開発と改善を行っており、プロトタイプを完成させつつある。6)統計的ユーザモデル及び統計的対話モデルについては、対話制御の効率的な統計的モデル化の検討を行うとともに、目標である他層情報との密結合の試行として、発語行為(音声の発話タイミング)を対話制御に直接反映させてモデル化する手法を検討し、評価した。
|
Research Products
(17 results)