研究課題/領域番号 |
03452167
|
研究機関 | 豊橋技術科学大学 |
研究代表者 |
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
|
研究分担者 |
山本 幹雄 豊橋技術科学大学, 工学部, 助手 (40210562)
井上 克巳 豊橋技術科学大学, 工学部, 講師 (10252321)
|
キーワード | 音声入力 / 音声認識 / 対話システム / 音声対話 / あいまいな入力 / 音声理解 / 言語理解 |
研究概要 |
本一般研究は、実際に動作する音声対話システムを構築するために重要である音声発話文のあいまいさについて広い範囲の検討を行なった。 1.言語のあいまいさ エルゴディックHMMを用いて4カ国語の言語識別を行ない、HMMの尤度とHMMの最適状態系列を用いる識別基準で、98%の識別率を得た。 2.音韻認識のあいまいさ 間投詞や未知語を含む音声を認識するために間投詞・未知語を任意の音韻系列でモデル化する認識手法を検討し、この手法が全出現投詞の辞書登録法よりも高い認識精度を持ち、未知語にも対応できることを示した。 3.話者のあいまいさ 最大事後確率推定法を用いた連結学習による教師あり話者適応化と、教師なし話者適応化について提案・検討を行ない、言語情報に基づく文認識結果をそのまま教師信号とする教師なし話者適応手法が、教師あり話者適応化手法に匹敵する性能を持つことを明らかにした。 4.自然な発話のあいまいさ 音声対話文における助詞落ち、倒置、間投詞、ポーズ、言い直しについて統計的な分析と処理手法の提案を行なった。 5.解釈・生成のあいまいさ 音声対話システムが入力文の認識・解釈と応答文生成を行なう段階でのあいまいさを排除するためのいくつかの手法を検討した。 6.入力表出のあいまいさ 連続文音声認識手法を用いた音声対話システムでは、ユーザにとってどのように発声すればよいかがあいまいである。このあいまいさを削減するために、メニューに基づく音声入力手法と、画像やタッチパネルと音声入力を併用したマルチモーダルな入力手法を提案・評価した。
|