自然な発話におけるさまざまな誤り・ノイズを含む認識結果をエラー対応型一般化LR構文解析法を用い、小さな誤りは修正し大きな誤りはダミーの非終端記号を割り当てることで、確かに認識できる部位とそうでない部位を区別しつつ解析を進める技法について研究を行った。この統語的解析と並行して意味解析も行い、発話の意味を抽出することにした。さらに未知語の処理を行い、発見された未知語を逐次システムに組み入れるアルゴリズムを開発した。システム構築に際しては対話型という点を利用し、不明解な部位についてはシステム側が無理に判断するのではなく、話者にインタラクティヴに尋ねるといった柔軟な機構をもたせている。本年度は以上の方針を中規模の文法で実験し、有効性を確認した。 また、以上のほかに関連研究として次の2つの事柄を行った。 1.音声認識部として、Hidden Markov Modelを簡便に扱うHTKというツールを使用し、自由発話を扱える認識モジュールの開発に着手した。学習モデルの作成には東北大・松下単語音声データベースを用い、音韻単位の認識実験を行った。 2.LRバーザを生成するツールとしてはYaccが有名だが、これはあいまい性のある文法を扱えない。そこでYacc形式で記述された任意の文脈自由文法に対処できる‘NLyacc'を作成した。現時点でNLyaccには上で述べたような誤り対応の機能は付与されていないが、パーザジェネレータとしては実用性があるので、フリーソフトウェアとして配布を始めた。
|