日本語要求仕様をオブジェクト指向分析し、分析図を自動生成するシステムを開発するという当初の目的を達成するために、97年度の研究成果として、全体を3つのシステムに分けることにした。第1は日本語文章を解析し意味フレーム群に展開するシステムSAGEである。第2は意味フレーム群を入力しオブジェクト指向分析を行うルールベースシステムCAMEO/Aである。第3はCAMOE/Aが問題を解く毎にその分析結果の誤りを指定するだけでルールベース全体を正しく更新する理論更新シスtレムTHERESである。 SAGEは、当初JANUSと呼ばれ、構文解析をベースに行うシステムとして考えていたものである。しかし、構文木の曖昧性が多いためこの手法を改め、奈良先端科学技術大学院大学松本研究室の茶筅による係り受け解析の結果を基に、EDR電子化辞書を用いて統計的に最も可能性の高い意味的解釈結果を生成する方式に換えた。しかし、今年度完成したものはまだ語意間の格の決定において誤りが多い。これは、格の決定が問題文そのものよりも共起辞書における統計に強く依存するからである。CAMEO/Aについては、従来からあるプロトタイプを分類先のモデリング要素毎に異なるヘッド部を持つ述語として書き直した。なお、SAGEの研究と並行して行ったために、入力とする意味フレームが持つ格はEDRのものではなく、従来から我々が設定していたものを用いており、SAGEと結合して用いるには格に関する条件部分を書き直す必要がある。THERESについてはほぼ全体のプロトタイプが完成した。THERESは、まず誤ったルールRを探し、次にこれが導出する正・負事例を分離するルールD(弁別ルール)をprogolを用いて獲得し、最後にRのボディ部にDのボディ部を論理積の形で加える。このような修正方式は、エキスパートが作成した既存のルールに例外に対する漏れていた制約を加えるのに似ており、事例から帰納学習で獲得したルールで基本のルールを置き換えるのに比べて、より実際的である。
|