本研究の主眼は、従来の音声認識研究の対象であった“良い条件下でのきちんとした発声"から“より自然な発声"の認識へと対象を広げる際に生ずる様々な問題に頑健に対応することにある。これまで文脈自由文法に基づいた一般LR構文解析法を用いた言語処理の方法を追求してきたが、さまざまな誤り回復機能を付与した一般LR構文解析法を用いて、小さな誤りは訂正しつつ、確実に認識できる部位とそうでない部位を明らかにする。不明確な部位は、“ギャップ埋め"という技法でダミ-の非終端記号で表される。 文脈自由文法を用いた解析法のうちEarleyのアルゴリズムは、nを入力列の長さとしてO(n^3)の時間でおさえられることがわかっている。一般LR構文解析法においては、pを書き換え規則の最長右辺項数としてO(n^<p+1>)とできるので、使用する文法によっては効率が大幅に落ちる可能性を含んでいる。しかしながらChomskyの標準形定理からp【less than or equal】2に抑えられるように文法を等価に書き変えることができるので、理論的にはO(n^3)で抑えられると言える。 ギャップ埋めの機能を付与することにより、文法をより柔軟に使うことが出来る反面、一般LR構文解析法の計算量は増大してしまう。さまざまな文法を用いて高率の比較実験でこのことを確認した。そこで、何らかのヒューリスティックスを導入することでこの増大する計算量を抑えることになる。これは、使用目的によって異なるのだが、ダミ-の非終端記号ごとに入力列をどれほど消費するべきかをきめ細かく決めたり、ダミ-の非終端記号は2つ続けて発生させないといったことで制御でき、しかも実用上有益であることが分かった。
|