研究概要 |
本研究の主眼は、速度と精度の両面において、充分に実用に供せる意味・文脈解析システムSAGEを開発することである。この目的のために本年度は以下の事を行い、下記のような成果を得た。また応用として、要約システムABISYSを開発した。 精度評価の自動化:EDR辞書のcorpus辞書に含まれる22万文例にのぼる専門家による解析済みコーパスと我々の成果を自動的に比較するシステムEval Sageを昨年度開発したが、この際手作業として残った両解析の対応付けの自動化と概念IDの文字列表現語意の表示機能の追加を行った。これによって、評価や誤り分析が容易に行えるようになった。 精度向上:Eval Sageを用いて昨年度のSAGEの解析結果を評価した結果、複合語への展開や数詞の語意判定にバグがあったのでこれを修正した。また連体・使役・受身表現に対する精度が悪いことが判明した。連体表現においては,用言から体言への修飾方向の逆向きの補足関係を表す係り受け関係を仮定し,これを元に辞書検索し語意と格の確率計算を行うことによって解析精度を向上した.また,受動表現と使役表現については,適切な表層格を仮定し,これを能動態表現に変換してから,辞書検索することによって解析精度を向上した.この結果,語意精度89.2%,深層格精度89.0%を達成した. 利用性:茶筅、南瓜、JUMAN、KNP、presage、SAGEをファイル経由で連結して、形態素解析、係り受け解析、意味解析を一貫して行えるようにした。また,SAGE Web serverを開発し,インターネット上で利用できるようにした. 文脈解析:指示代名詞の先行詞の特定を行う照応解析システムANASYS/Dを開発した。 応用:SAGEが出力した格フレーム群を入力して要約文を生成するABISYSを開発した。ABISYSの要約手法は、反復語句に基づく重要後の選出に基づいており、ルールは語意と深層格にのみ依存しているので対象文章を選ばない。要約率は約30%程度で、人による要約例とほぼ同程度の内容を含んでいた。
|