研究概要 |
日本語要求仕様を構文解析・意味解析し意味フレーム群に展開し、さらにこれらを元にオブジェクト指向分析し、分析図を自動生成するとともに、分析ルール群を自動的に更新するシステムを開発するという当初の目的を達成するために、98年度の研究成果として、前半部に当たる日本語仕様の意味解析を行うSAGEの分析精度を向上する研究とオブジェクト指向分析を行うCAMEOの初期分折ルールの精密化を行った。 従来は、SAGEにおいて意味フレームを生成するために語彙の概念IDと語彙間の格を決定する際に,EDR電子化辞書における確率情報をもとに解釈木の確信度を計算し,この確信度が最大値を取る概念IDと格の組み合わせを用いることにしていた.しかし,この組み合わせでも誤りが目立つので,最大確信度が一定値よりも低い場合は,構文情報から格を推定する方が効果的であると考えた.そこでオブジェクト指向分析の観点から日本語文法を分析し,表層的な構文情報から深層格を決定する方法を考案し,実装した.また,助動詞や複合語の意味フレームを出力するようにした.これによってSAGEとCAMEOにおける意味フレーム表現を統一できた.一方、CAMEOの分析ルールを全体的に見直し、足りなかうたルールを追加し,分析ルールに使用していた格をEDR電子化辞書で使用している格へ変更した.これによって、エレベータ問題を用いて97年度のSAGEと98年度のSAGEを比較した結果,意味フレームにおける正解フレーム数(19→78),概念IDの正解率(46.2%→64.8%),格の正解率(44.9%→60.2%)についてある程度の精度の向上が達成された.また,GAMEOから抽出されたモデリング要素の正解率(18.2%→66.7%)においても精度の向上が見られた.
|