研究課題/領域番号 |
21300066
|
研究機関 | 名古屋工業大学 |
研究代表者 |
李 晃伸 名古屋工業大学, 大学院・工学研究科, 准教授 (80332766)
|
研究分担者 |
西村 竜一 和歌山大学, システム工学部, 助教 (00379611)
駒谷 和範 名古屋工業大学, 大学院・工学研究科, 准教授 (40362579)
南條 浩輝 龍谷大学, 理工学部, 助教 (50388162)
西田 昌史 同志社大学, 理工学部, 准教授 (80361442)
篠崎 隆宏 千葉大学, 大学院・融合科学研究科, 助教 (80447903)
秋田 裕哉 京都大学, 情報メディアセンター, 助教 (90402742)
|
キーワード | 音声言語理解 / 音声対話 / 音声認識 |
研究概要 |
本研究課題の目的は、音声言語理解において、信号処理から意味理解、ユーザモデルまでの各層の実際的な関係や統計的性質を明らかにし、それに基づいて処理を確率的に密統合することで、より高度かつ柔軟な音声言語処理と、高度な音声言語インタフェースを実現することである。 H23年度は、昨年度までの成果をベースに、各層間で制約や処理の統合を推し進めるとともに、研究成果をまとめる次世代対話システムの構築を開始した。1)制約条件の調査では、昨年度までの各層における議論を元に、各層でのリアルタイムな制約や照合・予測情報の関連付けについて討議を行った。また、音声区間検出が音声認識性能に与える影響の調査や、逆に音声認識処理中の情報から音声終了区間を判定(早期確定)する手法の有効性検証など、フロントエンド処理との密統合について研究・検証を進めた。2)言語モデルについては、言語・発音モデルの統計的変換手法を探索過程へ動的に組み込む方法を検討するとともに、音声対話向けのコーパス改良、Web知識を利用した言語モデルのタスク適応の高度化等について研究した。3)ベイズリスク最少化深索においては、昨年度開発した情報検索システムにおいて、タスクにおける単語重要度をベイズリスクとして組み入れる試みを行い、タスク知識等の上位知識との密統合について実証と検証を進めた。4)音響モデルについては、話者や環境、コンテキストなど、モデルの制約条件の変化に対応できる音響モデルの構造について、その設計と検証を試みた。5)データ収集用音声対話システムについては、研究代表者らが構築した音声インタラクションシステム構築ツールキット「MMDAgent」をベースに、実験評価用の音声対話システムを構築した。特に、信号処理から音声認識、応答の表象までを統合した高度なインタラクションを行うためのモーション制御等について考案し実装した。6)統計的ユーザモデル及び統計的対話モデルについては、対話制御の効率的な統計的モデル化の検討を引き続き行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
音響モデル、言語モデルの層と多層の統合については検討にとどまったが、各層における技術の検討、ならびにフロントエンド層とタスク層の認識処理への統合については研究がよく進展した。またシステムの構築についても高度な統合が行えるソフトウェア基盤の開発が進んでおり、総じて順調に進展している。
|
今後の研究の推進方策 |
最終年度へ向けて具体的な音声対話システムとして結実させる必要がある。具体的なアプリケーションに対して諸要素を効率的に統合しつつトータルで多階層の統合が行える音声対話システムを目指して、それを実証するに有効なタスクを決定し、それに向かって各層を統合していく必要がある。
|