• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2004 年度 実績報告書

検索意図と文書特性に基づいて特定の観点から内容をまとめる柔軟な複数文書自動要約

研究課題

研究課題/領域番号 16650053
研究機関国立情報学研究所

研究代表者

神門 典子  国立情報学研究所, ソフトウェア研究系, 教授 (80270445)

キーワード複数文書要約 / 観点 / 文書ジャンル / 情報のタイプ / 意見の要約 / 意見 / 要約の評価
研究概要

自動要約研究では,従来、主として文書中の単語の出現頻度を手がかりとして重要な話題を含む箇所を抽出する手法が用いられてきた.しかしながら、たとえ同じ文書集合が与えられたとしても、その中で重視する観点は、個々の利用者の検索の目的によって異なる。
観点はさまざまなものが考えられるが、今年度は、話題と利用者が重視する情報のタイプ(事実を知りたいのか、意見を知りたいのか、定義などの知識を得たいのかなど)に着目して要約を作成する複数文書要約器v-SWIMを提案した。また、ベースラインシステムとして、情報のタイプを識別しない複数文書要約器SWIMを構築した。
SWIMでは、複数のクラスタリング手法の比較実験をし、段落単位のWard法によるクラスタリングを採用した。v-SWIMは、検索結果などの文書集合が与えられると、その内容を自動分析し、その文書集合に含まれる話題のリストと情報タイプのリストを利用者に提示する。利用者が関心のある話題と情報タイプを選択すると、v-SWIMは選択された話題と情報タイプを重視して要約を作成する。情報タイプを識別するために、語の出現頻度に加えて、文書ジャンルと文役割を用いた。文書ジャンルは多様な文書の種類に柔軟に対応できるように、複数の基本的な属性の組み合わせとしてジャンル特性を定義した。
SWIMは、多数の要約研究システムが参加する評価NTCIR-4 tsc-3において上位の成績を収めた。また、重視する情報タイプ別に人が作成した参照要約を持つ要約実験用データセットViewSumm30を作成し、それを用いて評価実験をおこなったところ、closedな実験ではあるが、v-SWIMは、文書ジャンルや文役割を用いないベースラインシステムSWIMよりも有意に要約の有用性が向上した。Openな評価と複数の観点の対比は来年度の課題である。

  • 研究成果

    (5件)

すべて 2005 2004

すべて 雑誌論文 (4件) 図書 (1件)

  • [雑誌論文] 利用者の情報要求を考慮した観点に基づく複数文書要約とその評価2005

    • 著者名/発表者名
      関洋平, 江口浩二, 神門典子
    • 雑誌名

      情報処理学会論文誌:データベース 46・TOD26(採択済, 掲載予定)

  • [雑誌論文] Analysis of Multi-Document Viewpoint Summarization Using Multi-Dimensional Genres2004

    • 著者名/発表者名
      Yohei Seki, Koji Eguchi, Noriko Kando
    • 雑誌名

      In Proceedings of AAAI Spring Symposium on Exploring Attitude and Affect in Text : Theories and Applications, Stanford, CA., Technical Report SS-04-07, ISBN 1-57735-219-x

      ページ: 142-145

  • [雑誌論文] 事実・意見・知識に焦点を当てた観点に基づく複数文書要約2004

    • 著者名/発表者名
      関洋平, 江口浩二, 神門典子
    • 雑誌名

      情報処理学会研究報告 NL-161-6

      ページ: 39-46

  • [雑誌論文] User-focused Multi-document Summarization with Paragraph Clustering and Sentence-type Filtering2004

    • 著者名/発表者名
      Yohei Seki, Koji Eguchi, Noriko Kando
    • 雑誌名

      In Proceedings of the Fourth NTCIR Workshop on Evaluation of Information Access Technologies : Information Retrieval, Question Answering, and Summarization, Tokyo, Japan 4

      ページ: 459-466

  • [図書] "Multi-Document Viewpoint Summarization Focused on Facts, Opinion and Knowledge". In Computing Attitude and Affect in Text (J.G.Shanahan, Y.Qu, J.Wiebe (eds))2005

    • 著者名/発表者名
      Yohei Seki, Koji Eguchi, Noriko Kando
    • 総ページ数
      20
    • 出版者
      Springer(刊行予定)

URL: 

公開日: 2006-07-12   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi