照応解析では、言語的制約として「統語論以外の情報をいかに融合させるか」が重要な課題である。そして、そうした制約を記述することは、単に自然言語の形式的性質を示すということだけでなく、計算機による文処理のアルゴリズムを考えることにも通じている。 制約文法に基づく文法実装JPSGは、こうした言語(処理)観を最も反映させやすい枠組みである。しかしながら、個人研究を中心に発展してきたため、その理論射程と分析対象の狭さによって、照応解釈の検討を要する種々の文に対する被覆率が低いという切実な問題があった。 そこで、本研究はJPSGを発展させる準備として、高い被覆率を持った既存の制約文法に基づく枠組を検討し、得られた知見を文法拡張に反映させることにした。 JaCYは、言語知識構築基盤LKBの上に実装された日本語文法であるが、その主たる関心は対話コーパスの解析であった。文としては比較的短い発話においても、指示・代用・省略・接続といった文法的要因に関する談話の関連性は見受けられたが、そうした現象に対するJaCYの制約の一部はアドホックな記述であった。 本研究ではそうした問題をJaCY/JPSGの枠組に依存しない問題としで整理する一方で、対話文よりも長い文を解析できるように文法拡張を行った。対象とした辞書定義文は同一語・同義語・上位語による繰り返しや関連語の共起といった語彙的要因に関する談話の関連性を含んでいる。その適切な解釈にはいわゆる世界知識の肩代わりとなるような統計情報が必要であることがわかったが、その実現は今後の課題として残った。
|