2003 Fiscal Year Annual Research Report
Project/Area Number |
13680444
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
増山 繁 豊橋技術科学大学, 工学部, 教授 (60173762)
|
Keywords | テキスト自動要約 / 複数文書要約 / ユーザインタラクション / 情報アクセス技術 / 自然言語処理 |
Research Abstract |
本年度は、最終年度として、主として以下の成果を得た。 I.要約の要素技術の一つとして重要な、文内の不要箇所削除技法として、文内の要素の削除可能性をコーパスから得られる統計的情報で決定する手法に関して成果を得た。 1.動詞連体修飾節の削除可能性に関するコーパスからの知識獲得 削除できる可能性のある動詞を含む連体修飾節が修飾している名詞に対して修飾されやすさ、修飾多様性をコーパスからエントロピーとして計り、修飾される頻度が低い、修飾する動詞の種類が限定されている動詞連体を削除可能と認定するなどを行なう手法を考案し、その有効性を実験的に検証した。 2.多重連体修飾節の削除可能性に関するコーパスからの知識獲得 多重連体修飾句の削除可能性を、連体修飾句と被修飾名詞との相互情報量等を計ることにより求める手法を提案し、その有効性を実験的に検証した。 II.要約研究の中で実用上特に重要な、複数文書要約に関して成果を得た。 1.様々なヒューリスティックスを組み合わせた複数文書要約システム 構文解析に基づき、複文における冗長性の認定による削除、直接引用表現の削除可能性の認定等、きめの細かいヒューリスティックスを用いた文内削除を行なう手法を提案した。 2.ユーザとのインタラクションを導入した複数文書要約システム 複数文書要約においては、対象となる文書集合が複数の話題を含むことである。 しかしながら、ユーザはそれらの話題すべてに興味を持つとはかぎらず、ユーザ毎、また、同じユーザでもそれぞれの場合の目的毎に異なった要約が必要となる。そこで、対象となる文書集合からキーワードを抽出してユーザに提示し、選択させることで、ユーザ適合した要約を生成する手法を提案した。
|
-
[Publications] 酒井 浩之, 増山 繁: "動詞連体修飾節の省略可能性に関するコーパスからの知識獲得"電子情報通信学会論文誌. D-II(採録決定). (2004)
-
[Publications] Tatsumi Yoshida, Shigeru Masuyama: "Multiple summarization system GOLD"IEICE Transactions on Information and Systems. E-86-D・9. 1719-1727 (2003)
-
[Publications] Hiroyuki Sakai, Shigeru Masuyama: "A statistical method for acquiring knowledge about the abbreviationpossibility of some of multiple adnomial phrases"IEICE Transactions on Information and Systems. E86-D・9. 1710-1718 (2003)