2001 Fiscal Year Annual Research Report
Project/Area Number |
12680372
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
尾関 和彦 電気通信大学, 電気通信学部, 教授 (50214135)
|
Co-Investigator(Kenkyū-buntansha) |
高木 一幸 電気通信大学, 電気通信学部, 助手 (70272755)
|
Keywords | 係り受け解析 / 係り受け整合度 / 文節重要度 / 文簡約 |
Research Abstract |
本年度は、主として係り受け解析を文簡約に応用するための研究を行った。文簡約とは文書要約の一種であり、原文の持つ情報と文としての自然さをできるだけ保持しながら、それを短縮する技術である。昨年度、そのためのアルゴリズムを考案した。これを用いた簡約システムを実際に動かすには、係り受け整合度と文節重要度の情報を与える必要がある。それらを定めるため、京都大学コーパスを用いて、次のような実験を行った。そして、このシステムによって得られる簡約文の質を被験者を用いて主観的に評価した。 1.約34, 000文を用いて係り受け規則と係り受け距離の分布を推定し、それに基づいて係り受け整合度を定めた。 2.200文を13名の被験者によって簡約し、どのような種類の文節が簡約文の中にどの程度の割合で残されたかを測定した。これに基づいて、文節重要度を定めた。 3.係り受け整合度と節分重要度に与える重みを定めるため、前記200文の中から20文を選び、種々の重みに対して、簡約文を自動的に生成した。その結果を3名の被験者により評価し、最適な重みを決定した。 4.上のように定めたシステムパラメータを用いて、2.で用いたものとは別の200文をいくつかの簡約率において自動簡約した。 5.得られた簡約文の質を5名の被験者により評価し、人の簡約結果、およびランダムな簡約結果と比較した。 その結果、このシステムにより得られる簡約文の質は人の簡約結果には及ばないが、ランダムな簡約結果よりはかなり高いことが分かり、その有効性が示された。今後は、人の簡約結果に近づけるための改良が必要である。
|
Research Products
(2 results)
-
[Publications] 小黒 玲: "文節重要度と係り受け整合度に基づく日本語文簡約アルゴリズム"自然言語処理. Vol.8, No.3. 3-18 (2001)
-
[Publications] 小黒 玲: "文節重要度と係り受け整合度に基づいた文簡約実験"電子情報通信学会技術研究報告. NLC2001-3. 15-20 (2001)