研究課題/領域番号 |
08780349
|
研究種目 |
奨励研究(A)
|
配分区分 | 補助金 |
研究分野 |
知能情報学
|
研究機関 | 京都大学 |
研究代表者 |
河原 達也 京都大学, 工学研究科, 助教授 (00234104)
|
研究期間 (年度) |
1996
|
研究課題ステータス |
完了 (1996年度)
|
配分額 *注記 |
1,000千円 (直接経費: 1,000千円)
1996年度: 1,000千円 (直接経費: 1,000千円)
|
キーワード | 音声理解 / 言語モデル / フレーズ / スポッティング / A^*探索 |
研究概要 |
頑健な音声認識を実現するためには、理解に重要な部分を抽出(スポッティング)して、それを基に意味表現を形成していく方式が有望である。従来の単語を単位とするスポッティングでは、マッチングのテンプレートが小さく、また構文的な知識を基本的に利用しないので、局所的な類似性やノイズの影響を受けやすく、結果として誤った単語候補が多数生成された。そこで本研究では、単語ではなく、フレーズのスポッティングに基づくアプローチを研究した。フレーズは、"今日から"や"午後3時に"などのように、単語の組合せ(フレーズ文法)で構成され、意味表現の要素になる単位である。 本アプローチは、(1)単語連鎖、(2)フレーズ構文、(3)フレーズ間制約の順に、徐々に強い制約を適用していく段階的探索戦略に基づいており、各段階の処理は、前段階の結果をヒューリスティックとするA^*探索として実現した。フレーズをスポッティングの単位とすることにより、単語スポッティングに比較してかなり高い抽出率を得た。本スポッティングアルゴリズムは,best-first探索であるので、フレーズ候補を正しくスコア順に得ることができる。さらに、このスポッティングに基づく文認識・理解のためのA^*探索アルゴリズムを、ラティスパージングとトレリスパージングの両方について考案した。最適な探索戦略を実現することで、認識精度を低下させることなく、非定型発話に対する頑健性を実現した。
|