2002 Fiscal Year Annual Research Report
日本語文章の常識を用いた意味理解・文脈理解システムの開発研究
Project/Area Number |
13680461
|
Research Institution | Aoyama Gakuin University |
Principal Investigator |
原田 実 青山学院大学, 理工学部, 教授 (10218654)
|
Co-Investigator(Kenkyū-buntansha) |
関 洋平 青山学院大学, 理工学部, 助手 (00348468)
|
Keywords | 意味解析 / 照応解析 / 深層格 / 語意 / ゼロ代名詞 / 複文解析 / 従属節 / 連体節 |
Research Abstract |
本研究の主眼は、速度と精度の両面において、充分に実用に供せる意味・文脈解析システムSAGEを開発することである。この目的のために本年度は以下の事を行い、下記のような成果を得た。また応用として、要約システムABISYSを開発した。 精度評価の自動化:EDR辞書のcorpus辞書に含まれる22万文例にのぼる専門家による解析済みコーパスと我々の成果を自動的に比較するシステムEval Sageを昨年度開発したが、この際手作業として残った両解析の対応付けの自動化と概念IDの文字列表現語意の表示機能の追加を行った。これによって、評価や誤り分析が容易に行えるようになった。 精度向上:Eval Sageを用いて昨年度のSAGEの解析結果を評価した結果、複合語への展開や数詞の語意判定にバグがあったのでこれを修正した。また連体・使役・受身表現に対する精度が悪いことが判明した。連体表現においては,用言から体言への修飾方向の逆向きの補足関係を表す係り受け関係を仮定し,これを元に辞書検索し語意と格の確率計算を行うことによって解析精度を向上した.また,受動表現と使役表現については,適切な表層格を仮定し,これを能動態表現に変換してから,辞書検索することによって解析精度を向上した.この結果,語意精度89.2%,深層格精度89.0%を達成した. 利用性:茶筅、南瓜、JUMAN、KNP、presage、SAGEをファイル経由で連結して、形態素解析、係り受け解析、意味解析を一貫して行えるようにした。また,SAGE Web serverを開発し,インターネット上で利用できるようにした. 文脈解析:指示代名詞の先行詞の特定を行う照応解析システムANASYS/Dを開発した。 応用:SAGEが出力した格フレーム群を入力して要約文を生成するABISYSを開発した。ABISYSの要約手法は、反復語句に基づく重要後の選出に基づいており、ルールは語意と深層格にのみ依存しているので対象文章を選ばない。要約率は約30%程度で、人による要約例とほぼ同程度の内容を含んでいた。
|
-
[Publications] 原田実, 鈴木亮, 南児瑞: "意味グラフのマッチングによる事故問い合わせ文からの判例検索システムJCare"言語処理学会論文誌. Vol.9,No.4. 3-20 (2002)
-
[Publications] 原田実, 田淵和幸, 大野博之: "日本語意味解析システムSAGEの高速化・高精度化とコーパスによる精度評価"情報処理学会論文誌. Vol.43,No.9. 2894-2902 (2002)
-
[Publications] 矢後友和, 原田実: "反復語句と深層格に基づく要約システムABISYSの開発"情報処理学会自然言語処理学会研報. 03-NL-153. 17-23 (2003)
-
[Publications] 井村裕, 沓掛俊樹, 佐藤直美, 原田実: "意味解析システムSAGEのWeb化と連体・使役・受身における解析精度向上"情報処理学会自然言語処理学会研報. 03-NL-153. 25-32 (2003)
-
[Publications] 山岸 謙治, 村松 孝彦, 原田 実: "語意に基づく深層レベルの指示代名詞照応解析システムAnasys/D"情報処理学会自然言語処理学会研報. 03-NL-153. 33-40 (2002)