研究概要 |
頑健な音声認識を実現するためには、理解に重要な部分を抽出(スポッティング)して、それを基に意味表現を形成していく方式が有望である。従来の単語を単位とするスポッティングでは、マッチングのテンプレートが小さく、また構文的な知識を基本的に利用しないので、局所的な類似性やノイズの影響を受けやすく、結果として誤った単語候補が多数生成された。そこで本研究では、単語ではなく、フレーズのスポッティングに基づくアプローチを研究した。フレーズは、"今日から"や"午後3時に"などのように、単語の組合せ(フレーズ文法)で構成され、意味表現の要素になる単位である。 本アプローチは、(1)単語連鎖、(2)フレーズ構文、(3)フレーズ間制約の順に、徐々に強い制約を適用していく段階的探索戦略に基づいており、各段階の処理は、前段階の結果をヒューリスティックとするA^*探索として実現した。フレーズをスポッティングの単位とすることにより、単語スポッティングに比較してかなり高い抽出率を得た。本スポッティングアルゴリズムは,best-first探索であるので、フレーズ候補を正しくスコア順に得ることができる。さらに、このスポッティングに基づく文認識・理解のためのA^*探索アルゴリズムを、ラティスパージングとトレリスパージングの両方について考案した。最適な探索戦略を実現することで、認識精度を低下させることなく、非定型発話に対する頑健性を実現した。
|