1993 Fiscal Year Annual Research Report
音声入力を想定したあいまいな発話文の理解システムに関する研究
Project/Area Number |
03452167
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
|
Co-Investigator(Kenkyū-buntansha) |
山本 幹雄 豊橋技術科学大学, 工学部, 助手 (40210562)
井上 克巳 豊橋技術科学大学, 工学部, 講師 (10252321)
|
Keywords | 音声入力 / 音声認識 / 対話システム / 音声対話 / あいまいな入力 / 音声理解 / 言語理解 |
Research Abstract |
本一般研究は、実際に動作する音声対話システムを構築するために重要である音声発話文のあいまいさについて広い範囲の検討を行なった。 1.言語のあいまいさ エルゴディックHMMを用いて4カ国語の言語識別を行ない、HMMの尤度とHMMの最適状態系列を用いる識別基準で、98%の識別率を得た。 2.音韻認識のあいまいさ 間投詞や未知語を含む音声を認識するために間投詞・未知語を任意の音韻系列でモデル化する認識手法を検討し、この手法が全出現投詞の辞書登録法よりも高い認識精度を持ち、未知語にも対応できることを示した。 3.話者のあいまいさ 最大事後確率推定法を用いた連結学習による教師あり話者適応化と、教師なし話者適応化について提案・検討を行ない、言語情報に基づく文認識結果をそのまま教師信号とする教師なし話者適応手法が、教師あり話者適応化手法に匹敵する性能を持つことを明らかにした。 4.自然な発話のあいまいさ 音声対話文における助詞落ち、倒置、間投詞、ポーズ、言い直しについて統計的な分析と処理手法の提案を行なった。 5.解釈・生成のあいまいさ 音声対話システムが入力文の認識・解釈と応答文生成を行なう段階でのあいまいさを排除するためのいくつかの手法を検討した。 6.入力表出のあいまいさ 連続文音声認識手法を用いた音声対話システムでは、ユーザにとってどのように発声すればよいかがあいまいである。このあいまいさを削減するために、メニューに基づく音声入力手法と、画像やタッチパネルと音声入力を併用したマルチモーダルな入力手法を提案・評価した。
|
Research Products
(6 results)
-
[Publications] 中川聖一: "ニューラルネットワークによる確率密度関数・事後確率の推定と母音認識" 電子情報通信学会論文誌. 76-DII. 1081-1089 (1993)
-
[Publications] 中川聖一: "ワードスポッティング法を用いた文脈自由文法制御フレーム同期型HMM連続音声認識法" 電子情報通信学会論文誌. 76-DII. 1329-1336 (1993)
-
[Publications] 中川聖一: "文脈自由文法制御によるOne Pass型連続音声認識" 電子情報通信学会論文誌. 76-DII. 1337-1345 (1993)
-
[Publications] 中川聖一: "最大事後確率推定法を用いた連続出力分布型HMMの適応化" 日本音響学会誌. 49. 721-728 (1993)
-
[Publications] 中川聖一: "エルゴディックHMMとその状態シーケンスを用いた音声による言語の識別" 電子情報通信学会論文誌. J77-A. 182-189 (1994)
-
[Publications] 中川聖一: "不特定話者の数字音声認識によるHMMと確率文脈自由文法の比較" 電子情報通信学会論文誌. J77-DII. 263-270 (1994)