2002 Fiscal Year Annual Research Report
Project/Area Number |
12680372
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
尾関 和彦 電気通信大学, 電気通信学部, 教授 (50214135)
|
Co-Investigator(Kenkyū-buntansha) |
高木 一幸 電気通信大学, 電気通信学部, 助手 (70272755)
|
Keywords | 係り受け解析 / 係り受け整合度 / 文節重要度 / 文簡約 / 短文分割 / サポートベクターマシン |
Research Abstract |
係り受け解析を文簡約に応用するための研究を前年度に引き続いて行なうと共に、係り受け解析および文簡約のための短文分割の研究を新たに行なった。 1.文簡約の研究 昨年度に行なった文簡約実験で、文末の述語が過剰に削除される現象が見られた。係り受け整合度を推定する際、文末文節は特別な取り扱いをしているが、その取り扱い方を変更し、係り受け整合度の推定法を改良した。それを用いて再度、簡約文の生成と主観評価を行なった。実験条件は昨年度とほぼ同様で、係り受け整合度の推定に約34,000文、文節重要度の推定に200文、最終的な評価用としてこれとは別の200文を使用した。簡約文の質を評価するための被験者数は5名である。評価は、(1)総合評価、(2)情報の保持に関する評価、(3)簡約文の文法的自然性に関する評価、の3つについて行なった。また、提案法による簡約を、人手による簡約およびランダム簡約と比較した。その結果、提案法による簡約文の質は、どの簡約率においても、人手による簡約とランダム簡約の中間に位置することが分かった。文法的自然性に関しては、提案法による簡約と人手による簡約の間に評価結果の差は見られなかった。 2.短文分割 日本語文章には、しばしば長文が現れる。長文を正確に係り受け解析することは大変困難であることが知られている。そのため、係り受け解析に先立って長文を短文に分割することが研究されている。本研究では、サポートベクターマシンを用いて短文分割を行なうための研究を行なった。短文分割点を定めるのに重要な役割をする文節の属性値をサポートベクターマシンの入力データとして短文分割実験を行った結果、適合率77%、再現率84%、文正解率72%が得られた。
|
Research Products
(7 results)
-
[Publications] Rei Oguro: "Evaluation of a Japanese sentence compression method based on phrase significance and inter-phrase dependency"Proceedings of TSD 2002. 27-32 (2002)
-
[Publications] Kazuyuki Takagi: "Combination of pause and F0 information in dependency analysis of Japanese sentences"Proceedings of ICSLP 2002. 2. 1173-1176 (2002)
-
[Publications] 諸岡祐平: "文節間係り受け整合度と文節重要度を用いて自動簡約した日本語文の主観評価"情報処理学会自然言語処理研究会資料. 153-2. 9-16 (2003)
-
[Publications] 根岸知弘: "サポートベクターマシンによる日本語長文の短文分割"言語処理学会第9回年次大会発表論文集. (発表予定). (2003)
-
[Publications] 諸岡祐平: "文節間係り受け整合度と文節重要度を用いた自動簡約文の主観評価"言語処理学会第9回年次大会発表論文集. (発表予定). (2003)
-
[Publications] 呂美蓉: "日本語読み上げ文の係り受け解析における複数ポーズ情報の利用"日本音響学会2003年春季研究発表会講演論文集. I(発表予定). (2003)
-
[Publications] 沖本真美子: "韻律情報を用いた日本語読み上げ文の係り受け解析におけるニューラルネットワークの利用"日本音響学会2003年春季研究発表会講演論文集. I(発表予定). (2003)