日本語要求仕様を構文解析・意味解析し意味フレーム群に展開するSAGE、意味フレーム群を元にオブジェクト指向分析し、分析図を自動生成するCAMEO、CAMEOの分析ルール群を自動的に更新するTHERESの3つのシステムを開発するという当初の目的の内、99年度はSAGEの高速化と分析精度向上の研究とTHERESの評価実験を行った。 SAGEの高速化は、解釈木構築において、枝刈り手法の考案や分枝限定法を適用することで実現した。また、分析精度の向上については、語意と格の候補の決定において、統計的尤もらしさを求める新しい計算法、経験ルールを用いた複文の解析法、品詞情報の利用、読み情報の利用といった手法を適用することで実現した。その結果、文節数7以下の文の平均解析時間が約59分から約15秒程度に短縮された。また、正解率も、語意が61.8%から82.1%に、格が45.2%から77.8%に改善された。 THERESの評価実験を20文のエレベータ問題(意味フレーム数224)を用いて行った。新正事例から学習されたルールは一般的過ぎて、この新ルールから抽出される事例が多くしかもほとんどが負事例なので、これらを導出しない様に修正する弁別ルールの学習は困難だった。一方、誤ったルールの修正については、CAMEOの分析知識を構成するクラス用6個、属性用8個、ロール用3個、関連用2個、イベント用7個のルールの中で、負事例を導出したルールを自動更新する事ができた。例えば、クラス用のある負事例を導出したルールに対して4つの弁別ルールが学習され、このルールは4つの新ルールに置き換えられた。今後の課題は、新正事例に対して学習された新ルールが一般すぎる、負事例のみからの更新ができない、などの問題を解決すること、またルール述語の修正に当たって既存の基本述語のみを用いるという前提条件を緩和できる更新方法の確立が課題になる。
|