研究概要 |
係り受け解析を文簡約に応用するための研究を前年度に引き続いて行なうと共に、係り受け解析および文簡約のための短文分割の研究を新たに行なった。 1.文簡約の研究 昨年度に行なった文簡約実験で、文末の述語が過剰に削除される現象が見られた。係り受け整合度を推定する際、文末文節は特別な取り扱いをしているが、その取り扱い方を変更し、係り受け整合度の推定法を改良した。それを用いて再度、簡約文の生成と主観評価を行なった。実験条件は昨年度とほぼ同様で、係り受け整合度の推定に約34,000文、文節重要度の推定に200文、最終的な評価用としてこれとは別の200文を使用した。簡約文の質を評価するための被験者数は5名である。評価は、(1)総合評価、(2)情報の保持に関する評価、(3)簡約文の文法的自然性に関する評価、の3つについて行なった。また、提案法による簡約を、人手による簡約およびランダム簡約と比較した。その結果、提案法による簡約文の質は、どの簡約率においても、人手による簡約とランダム簡約の中間に位置することが分かった。文法的自然性に関しては、提案法による簡約と人手による簡約の間に評価結果の差は見られなかった。 2.短文分割 日本語文章には、しばしば長文が現れる。長文を正確に係り受け解析することは大変困難であることが知られている。そのため、係り受け解析に先立って長文を短文に分割することが研究されている。本研究では、サポートベクターマシンを用いて短文分割を行なうための研究を行なった。短文分割点を定めるのに重要な役割をする文節の属性値をサポートベクターマシンの入力データとして短文分割実験を行った結果、適合率77%、再現率84%、文正解率72%が得られた。
|