• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2001 年度 実績報告書

情報検索結果の知的提示のための自動要約ならびにインタフェースに関する研究

研究課題

研究課題/領域番号 13224041
研究機関横浜国立大学

研究代表者

森 辰則  横浜国立大学, 大学院・環境情報研究院, 助教授 (70212264)

研究分担者 田村 直良  横浜国立大学, 大学院・環境情報研究院, 教授 (20179906)
キーワード情報利得比 / 重要語抽出 / 自動要約 / クラスタリング / 情報検索 / 利用者インタフェース
研究概要

本研究の目的は,情報検索の結果として得られた文書群から利用者が真に必要とする情報を効率良く選択する手助けとなる情報提示技法を確立することである.我々は,その根幹をなすものが「複数文書間の関係を考慮した重要語抽出」であると考え,複数文書の類似構造を文書中の語の重要度に写像するという新手法の確立を目標としている.本研究では,これを基幹技術として,検索文書の要約ならびに情報ナビゲーション向け情報提示に関する技術を開発する.
上記目的の下,本年度は以下に示す研究を行をい,知見を得た.
1.クラスタ構造に適応的な語の重要度決定手法ならびに自動要約への応用
表層的類似性により文書を複数のクラスタに分類した後,クラスタ中の各語について確率分布に関する情報利得比を求めると,これがそのクラスタの下位分岐構造と注目している語の間の整合性を表す尺度として利用できることを確認した.この重みを文書内頻度や文書頻度の逆数と組み合わせることにより,検索文書の要約に適した語の重みをつくることができることを示した.
2.静的なクラスタリングに基づくプロトタイプシステムの作成
上述の機構を持つプロトタイプシステムを検索エンジンと融合させる形で作成した.これは,ベクトル空間法に基づく基本的な検索エンジンの索引情報をそのまま流用し,クラスタリングや情報利得比の計算などを行なえるようにしたものである.クラスタリング機構にはBIRCHアルゴリズムを導入し大量の検索結果に対して対応可能である.
3.動的なクラスタリングに基づくインタフェースならびクラスタの説明記述生成に関する予備的検討
これは来年度の研究計画(申請中)における検討課題であるが,一部実装を進めており,評価を開始している.

  • 研究成果

    (1件)

すべて その他

すべて 文献書誌 (1件)

  • [文献書誌] 森 辰則: "検索結果表不向け文書要約における情報利得比に基づく語の重要度計算"自然言語処理. (掲載予定). (2002)

URL: 

公開日: 2003-04-03   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi