フレーズのスポッティングに基づく頑健な会話音声理解
Project/Area Number |
08780349
|
Research Category |
Grant-in-Aid for Encouragement of Young Scientists (A)
|
Allocation Type | Single-year Grants |
Research Field |
Intelligent informatics
|
Research Institution | Kyoto University |
Principal Investigator |
河原 達也 京都大学, 工学研究科, 助教授 (00234104)
|
Project Period (FY) |
1996
|
Project Status |
Completed (Fiscal Year 1996)
|
Budget Amount *help |
¥1,000,000 (Direct Cost: ¥1,000,000)
Fiscal Year 1996: ¥1,000,000 (Direct Cost: ¥1,000,000)
|
Keywords | 音声理解 / 言語モデル / フレーズ / スポッティング / A^*探索 |
Research Abstract |
頑健な音声認識を実現するためには、理解に重要な部分を抽出(スポッティング)して、それを基に意味表現を形成していく方式が有望である。従来の単語を単位とするスポッティングでは、マッチングのテンプレートが小さく、また構文的な知識を基本的に利用しないので、局所的な類似性やノイズの影響を受けやすく、結果として誤った単語候補が多数生成された。そこで本研究では、単語ではなく、フレーズのスポッティングに基づくアプローチを研究した。フレーズは、"今日から"や"午後3時に"などのように、単語の組合せ(フレーズ文法)で構成され、意味表現の要素になる単位である。 本アプローチは、(1)単語連鎖、(2)フレーズ構文、(3)フレーズ間制約の順に、徐々に強い制約を適用していく段階的探索戦略に基づいており、各段階の処理は、前段階の結果をヒューリスティックとするA^*探索として実現した。フレーズをスポッティングの単位とすることにより、単語スポッティングに比較してかなり高い抽出率を得た。本スポッティングアルゴリズムは,best-first探索であるので、フレーズ候補を正しくスコア順に得ることができる。さらに、このスポッティングに基づく文認識・理解のためのA^*探索アルゴリズムを、ラティスパージングとトレリスパージングの両方について考案した。最適な探索戦略を実現することで、認識精度を低下させることなく、非定型発話に対する頑健性を実現した。
|
Report
(1 results)
Research Products
(6 results)