2004 Fiscal Year Annual Research Report
情報検索結果の知的提示のための自動要約ならびにインタフェースに関する研究
Project/Area Number |
16016236
|
Research Institution | Yokohama National University |
Principal Investigator |
森 辰則 国立大学法人横浜国立大学, 大学院・環境情報研究院, 助教授 (70212264)
|
Co-Investigator(Kenkyū-buntansha) |
田村 直良 国立大学法人横浜国立大学, 大学院・環境情報研究院, 教授 (20179906)
|
Keywords | 複数文書要約 / 質問応答 / 情報ナビゲーション / 活性度伝播 / 情報検索 / 情報抽出 |
Research Abstract |
本研究の目的は、情報検索の結果として得られた文書群から利用者が真に必要とする情報を効率良く選択する手助けとなる情報提示技法を確立することである。我々は、その根幹をなすものが「複数文書間の関係を考慮した重要語抽出」であると考え、複数文書の類似構造を文書中の語の重要度に写像するという新手法の確立を目標としている。本研究では、これを基幹技術として、検索文書の要約ならびに情報ナビゲーション向け情報提示に関する技術を開発する。 本年度は、下記の知見を得た。 (1)複数の質問に焦点を当てた複数文書要約手法 近年、「質問の答に焦点を当てた要約」(Answer Focused Summarization)が注目されているが、これは、情報検索過程においては利用者が情報要求を持っており,また,それらが質問文として記述できるという考え方に基づく。複数文書要約においては内容把握ができるように、ある程度の要約文書量が必要であるので、利用者の知りたい事柄の一つ一つについて別々の要約文書を生成すると、最終的に利用者が読むべき文書量が増えてしまう。すなわち、複数の要求の答とその背景知識を一度に概観できるような要約が生成できることが望ましい。 そこで、昨年度に引き続き、利用者の持つ複数の情報要求に同時に答える要約を生成するために質問応答エンジンを文重要度計算に利用する手法を検討するとともに、評価型ワークショップであるNTCIR4 TSC3において評価を行なった。 (2)活性度伝播に基づく事件記事の重要箇所抽出 より粒度の細かい複数文書要約において、個々の文書の持つ情報構造を同一の枠組で捉える必要がある。文章の構成要素は種々の関係が影響しあい、抽出にはこの影響も考慮する必要がある。そこで、活性度伝播に基づく事件記事の重要箇所抽出を検討し、実装システムに基づき定性的な評価を行なった。
|