研究概要 |
本研究の目的は,情報検索の結果として得られた文書群から利用者が真に必要とする情報を効率良く選択する手助けとなる情報提示技法を確立することである.我々は,その根幹をなすものが「複数文書間の関係を考慮した重要語抽出」であると考え,複数文書の類似構造を文書中の語の重要度に写像するという新手法の確立を目標としている. 本研究では,これを基幹技術として,検索文書の要約ならびに情報ナビゲーション向け情報提示に関する技術を開発する. 本年度は,ナビゲーション過程や結果に現れる複数文書を対象とし,複数文書要約を生成する際の基本手法を検討した.上記目的の下,本年度は以下に示す研究を行ない,知見を得た 1.情報利得比に基づく語の重要度とMMRの統合による複数文書要約 上記重要語抽出手法をMMR(Maximal Marginal Relevance)と呼ばれる冗長性制御機構と組み合わせることにより重要文抽出に基づく複数文書要約が行なえることを示した.単純に組み合わせた方式では文書数が多くなったときに要約の質が落ちる傾向にあったが,これについて,ハニング窓による文重要度の平滑化手法により改善されることを確認した. 2.文章の構造解析による新聞記事からの事件情報抽出 より粒度の細かい複数文書要約においては,個々の文書の持つ情報構造を同一の枠糾で捉える必要がある.そこで,特定の領域に依存しつつも精度良く文書からそのスキーマを杣出する手法を提案・評価を行なった.特に新聞の事件記事から意味構造(事件スキーマ)を抽出する手法について検討した.
|