1994 Fiscal Year Annual Research Report
高精度音声認識と意味主導解釈による話者変動・非文法性に頑健な音声理解
Project/Area Number |
05452357
|
Research Institution | KYOTO UNIVERSITY |
Principal Investigator |
堂下 修司 京都大学, 工学部, 教授 (00025925)
|
Co-Investigator(Kenkyū-buntansha) |
荒木 雅弘 京都大学, 工学部, 助手 (50252490)
河原 達也 京都大学, 工学部, 助手 (00234104)
|
Keywords | 音声認識 / 自然言語理解 / 意味解析 / 話者変動 / ロバストパ-サ |
Research Abstract |
本研究は、話者変動・非文法性に頑健な音声理解システムの構築を目標とし、音声認識の高精度と自然言語の意味主導解釈手法の開発を目指すものである。平成6年度は、音声認識の高精度に関してはHMM音素認識器の話者適応化を行ない、意味主導解釈に関しては漸進的発話解析手法の開発を行なった。 1.HMM音素認識器の話者適応化 話者変動に関しては、連続音声を用いて音素認識器を未知話者に適応させる手法を検討した。具体的には、我々の研究室で開発した対判別HMM音素認識器を最大事後確率推定法によって話者適応化させる実験を8人の話者を対象に行った。結果としては、大きく認識率が向上する話者もあったが、逆に認識率が低下する話者も見られた。このことより、話者適応化に関しては適応用データの音響的スコアが大きく上昇することよりも、種々のデータに対して安定して上昇することが重要であるという結論が得られた。 漸進的発話解析 平成5年度に収集した対話データを分析したところ、自然な対話においては断片的な発話や発話の途中で切れたような中止文がしばしばみられることがわかった。これらは、文という単位を暗黙に仮定している従来手法や上記の手法では解決が難しい問題である。そこで、そのような非文法性に対しては、入力された句を単位として徐々に理解した構造を組み上げてゆく漸進的発話解析と、制約緩和法を用いることによって対処を試みた。実現に際しては、徐々に得られる句単位の部分的な情報を、メッセージ伝達を用いてプラン構造に統合することによって、文という単位に因われない解析手法を考案した。
|
-
[Publications] 河原達也: "単語対制約をヒューリスティックとするA^*探索に基づく会話音声認識" 電子情報通信学会論文誌. J77-DII,1. 1-8 (1994)
-
[Publications] 河原達也: "ヒューリスティックな言語モデルを用いた会話音声中の単語スポッティング" 電子情報通信学会論文誌. J78-DII(採録決定). (1995)
-
[Publications] M.Araki: "Cooperative Spoken Dialogue Model Using Bayesian Network and Event Hierarchy" Trans,IEICE. (to appear). (1995)
-
[Publications] T.Kawahara: "Heuristic search integrating syntactic,semantic and dialog-level constraints." Proc.IEEE Int'l Conf.Acoust,Speech & Signal Process.2. 25-28 (1994)
-
[Publications] T.Kawahara: "Keyword and phrase spotting with heuristic language model." Proc.Int'l Conf.on Spoken Language Processing. 2. 815-818 (1994)
-
[Publications] M.Araki: "A cooperative man-machine dialogue model for problem solving." Proc.Int'l Conf.on Spoken Language Processing. 2. 883-886 (1994)