会話音声中の単語スポッティング、及びヒューリスティックな言語的知識の表現に関して、以下のように研究を行なった。 1.単語スポッティングアルゴリズムの実現 本研究では、言語的知識をヒューリスティックな形で利用し、単語をスポッティングする方式を提案した。ここで利用する言語的知識は、精密な構文的知識ではなく、“言語(日本語)らしさ"といったものである。そして、入力発話全体の“日本語らしさ"を考慮した上での対象単語(キーワード)の存在する確からしさに基づいて、スポッティングを行なうアルゴリズムを考案した。219単語のスポッティング実験により、従来の始終端フリーマッチングと比較して、本手法が有効であることを示した。 2.ヒューリスティックな言語的知識の表現 “日本語らしさ"を評価するヒューリスティックな言語モデルとして、具体的にどのようなモデルが、認識率・頑健性の点で優れているか調べた。具体的には、音節バイグラム、単語連接モデル、単語対モデルなどを比較・検討した。それぞれ、定型的発話における認識精度と、非定型な発話に対する頑健性を評価した。その結果、(1)音節レベルの知識は頑健だが不十分である、(2)語彙レベルの知識が有効で非定型発話にも頑健である、(3)単語対制約は強力であるが頑健でない、などがわかった。
|