自由発話での倒置・言い足しに代表される語順の自由さを文脈自由文法ですべて書き表すことは容易ではない。しかも発話それ自体が非文であることも多くなる。従って、構文ルールを細かく書き下すことは現実的な対処ではなく、「構文的には緩く解釈し、発話の意味を抽出する」方策が必要になってくる。この方向の一段階として、構文的には緩い文法ルールを用いる一方、単語間の共起関係を意味情報として取り扱うことを提案した。単語間の共起関係を統計的に求めるために、文脈自由文法を用いたパ-ザに多くの文例を通し、各ルールにおける語間の関係を求める。このパ-ザは、一般LR解析法に語置換、語飛越し、語挿入、ダミ-の非終端記号を挿入するギャップ埋めといった4つの機能を付加したエラー対応型である。このようにして求めた語間の関係は、bigramやtrigramにおいては語間の表層的な関係しか得られないのに対して、構文的なつながりを反映するものとなる。解析時にこの共起関係を意味アクション中で取り扱うことで、エラー対応型LR解析法をより頑健にすることができる。 関連研究として、任意の文脈自由文法(ただし、A→Aのようなcyclicなルールは含まないとする)から一般LR構文解析パ-ザを生成するツールNLyaccの配布(ソースコード、文法例、ドキュメントを含む)を正式に開始した。今年度新たに付与した機能として、yaccと異なり字句解析モジュールから複数の値を受けとることができるようにした。これにより、‘saw'のように複数の品詞を取り得る語を簡便に扱えるようになった。
|