研究課題/領域番号 |
05452357
|
研究種目 |
一般研究(B)
|
配分区分 | 補助金 |
研究分野 |
知能情報学
|
研究機関 | 京都大学 |
研究代表者 |
堂下 修司 京都大学, 工学部, 教授 (00025925)
|
研究分担者 |
荒木 雅弘 京都大学, 工学部, 助手 (50252490)
河原 達也 京都大学, 工学部, 助手 (00234104)
北澤 茂良 静岡大学, 工学部, 助教授 (00109018)
|
研究期間 (年度) |
1993 – 1994
|
研究課題ステータス |
完了 (1994年度)
|
配分額 *注記 |
5,200千円 (直接経費: 5,200千円)
1994年度: 1,500千円 (直接経費: 1,500千円)
1993年度: 3,700千円 (直接経費: 3,700千円)
|
キーワード | 音声認識 / 自然言語理解 / 意味解析 / 話者変動 / ロバストパ-サ / ロバストパーサ |
研究概要 |
本研究は、話者変動・非文法性に頑健な音声理解システムの構築を目し、話者適応化による音声認識の高精度と、スポッティング手法と漸進的発話解析に自然言語の意味主導解析手法の開発を行なった。 1.HMM音素認識器の話者適応化 話者変動に関しては、連続音声いて音素認識器を未知話者に適応させる手法を検討した。具体的には、我々の研究室発した対判別HMM音素認識器を最大事後確率推定法によって話者適応化させる実験人の話者を対象に行った。結果としては、大きく認識率が向上する話者もあったが、認識率が低下する話者も見られた。このことより、話者適応化に関しては適応用デ-音響的スコアが大きく上昇することよりも、種々のデータに対して安定して上昇するが重要であるという結論が得られた。 2.単語・フレーズのスポッティング手法の開発 非文法的な発話にても、単語やフレーズなどの単位は文法に従って発話されることが多いことから、こを連続音声中からスポッティングする手法がまず必要になる。このスポッティングを度化するために、スポッティングされる以外の部分をヒューリスティックな言語モデ近似する手法を考案した。また、このスポッティングの結果を受け、間投語や未知語キップして文解析を行なう手法を開発した。 3.漸進的発話解析による頑健な音声理解 自然な対話においては断な発話や発話の途中で切れたような中止文がしばしばみられる。これらは、文というを暗黙に仮定している従来手法や上記の手法では解決が難しい問題である。そこで、ような非文法性に対しては、漸進的発話解析と制約緩和法を用いることによって対処みた。実現に際しては、徐々に得られる句単位の部分的な情報を、メッセージ伝達をてプラン構造に統合することによって、文という単位に因われない解析手法を考案した。
|