2002 Fiscal Year Annual Research Report
情報検索結果の知的提示のための自動要約ならびにインタフェースに関する研究
Project/Area Number |
14019041
|
Research Institution | Yokohama National University |
Principal Investigator |
森 辰則 横浜国立大学, 大学院・環境情報研究院, 助教授 (70212264)
|
Co-Investigator(Kenkyū-buntansha) |
田村 直良 横浜国立大学, 大学院・環境情報研究院, 教授 (20179906)
|
Keywords | 情報利得比 / Maximal Marginal Relevance / 重要語抽出 / ハニング窓 / 犯罪スキーマ / 情報抽出 / 情報検索 |
Research Abstract |
本研究の目的は,情報検索の結果として得られた文書群から利用者が真に必要とする情報を効率良く選択する手助けとなる情報提示技法を確立することである.我々は,その根幹をなすものが「複数文書間の関係を考慮した重要語抽出」であると考え,複数文書の類似構造を文書中の語の重要度に写像するという新手法の確立を目標としている. 本研究では,これを基幹技術として,検索文書の要約ならびに情報ナビゲーション向け情報提示に関する技術を開発する. 本年度は,ナビゲーション過程や結果に現れる複数文書を対象とし,複数文書要約を生成する際の基本手法を検討した.上記目的の下,本年度は以下に示す研究を行ない,知見を得た 1.情報利得比に基づく語の重要度とMMRの統合による複数文書要約 上記重要語抽出手法をMMR(Maximal Marginal Relevance)と呼ばれる冗長性制御機構と組み合わせることにより重要文抽出に基づく複数文書要約が行なえることを示した.単純に組み合わせた方式では文書数が多くなったときに要約の質が落ちる傾向にあったが,これについて,ハニング窓による文重要度の平滑化手法により改善されることを確認した. 2.文章の構造解析による新聞記事からの事件情報抽出 より粒度の細かい複数文書要約においては,個々の文書の持つ情報構造を同一の枠糾で捉える必要がある.そこで,特定の領域に依存しつつも精度良く文書からそのスキーマを杣出する手法を提案・評価を行なった.特に新聞の事件記事から意味構造(事件スキーマ)を抽出する手法について検討した.
|
Research Products
(4 results)
-
[Publications] 森 辰則: "検索結果表示向け文書要約における情報利得比に基づく語の重要度"自然言語処理. 9・4. 3-32 (2002)
-
[Publications] 中川 裕志, 湯本 紘彰, 森 辰則: "出現頻度と連接頻度に基づく専門用語抽出"自然言語処理. 10・1. 27-45 (2003)
-
[Publications] Tatsunori Mori: "Information Gain Ratio as Term Weight"Proc. of the 19^<th> International Conference on Computational Linguistics. 688-694 (2002)
-
[Publications] Hiroshi Nakagawa, Tatsunori Mori: "Simple but Powerful Automatic Term Extraction Method"Proc. of the 2^<nd> International Workshop on Computational Terminology. 29-35 (2002)