• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2005 年度 実績報告書

検索意図と文書特性に基づいて特定の観点から内容をまとめる柔軟な複数文書自動要約

研究課題

研究課題/領域番号 16650053
研究機関国立情報学研究所

研究代表者

神門 典子  国立情報学研究所, ソフトウェア研究系, 教授 (80270445)

研究分担者 関 洋平  豊橋技術科学大学, 情報工学系, 助手 (00348468)
キーワード複数文書要約 / 主観情報 / 観点 / 意見 / 感情 / 文のタイプ / 要約の評価 / 理由
研究概要

自動要約研究では,従来,主として文書中の単語の出現頻度を手がかりとして重要な話題を含む箇所を抽出する手法が用いられてきた.しかしながら,たとえ同じ文書集合が与えられたとしても,その中で重視する観点は,個々の利用者の検索の目的によって異なる.観点はさまざまなものが考えられるが,今年度は,(1)話題と主観情報,特に意見(肯定,否定)に着目した複数文書要約と,(2)感情ならびに感情が生じる理由の分析について研究を行った.
(1)については,文タイプ付与の精緻化について,文脈(前後の文の文タイプ)の影響を明らかにした.また,英語文書を対象とした文タイプの自動付与を実現した.さらに,要約の国際的な評価会であるDUC(Document Understanding Conference)に参加し,利用者の検索意図として主観情報を要求する質問を分類し,これらの質問に対し,主観晴報を含む文を抽出して要約を作成することの効果について検証した.その結果,肯定と否定を同時に求める要求("positive and negative factors"や"pros and cons")に焦点を当てた要約作成には,主観情報の抽出が効果的であることがわかった.また,日本語文書について,複数の被験者による要約のゆれを考慮した要約評価手法の分析のために,6人の被験者により主観情報に着目した要約のデータセットを作成した.
さらに,より挑戦的なタスクとして(2)の感情とその理由を抽出するための分析も行った.文書ジャンルは,(1)では主に新聞記事を対象としていたのに対し,(2)では書評や映画レビューなどを対象とした.この異なる文書特性の上では,自分が求める書籍や映画を推薦するために,感情とその感情が生じる理由を抽出することが重要であることを明らかにした.
これまでの研究により,検索意図として,主観情報を反映した複数文書要約についての研究はおおむね目標を達成したが,課題として被験者のゆれを考慮した評価手法と,異なる文書ジャンルにおける感情や理由の抽出の必要性が明らかになった.最終年度は,これらの課題に取り組む.

  • 研究成果

    (8件)

すべて 2006 2005

すべて 雑誌論文 (7件) 図書 (1件)

  • [雑誌論文] レビューにおける「理由」の重要性の分析〜被験者実験より〜2006

    • 著者名/発表者名
      中山記男, 神門典子
    • 雑誌名

      情報処理学会研究報告 自然言語処理研究会 NL-171-4

      ページ: 81-88

  • [雑誌論文] 感情表現における「理由」の働き2006

    • 著者名/発表者名
      中山記男, 神門典子
    • 雑誌名

      言語処理学会第12回年次大会論文集 12

      ページ: 1147-1150

  • [雑誌論文] 利用者の情報要求を考慮した観点に基づく複数文書要約とその評価2005

    • 著者名/発表者名
      関洋平, 江口浩二, 神門典子
    • 雑誌名

      情報処理学会論文誌:データベース 46・SIG8(TOD26)

      ページ: 106-119

  • [雑誌論文] Multi-Document Summarization Reflecting Information Needs on Subjectivity2005

    • 著者名/発表者名
      Yohei Seki, Koji Eguchi, Noriko Kando, Masaki Aono
    • 雑誌名

      Proc.of the Fifth NTCIR Workshop : Open Submission Session [Refereed] 5

      ページ: 521-528

  • [雑誌論文] Multi-Document Summarization with Subjectivity Analysis at DUC 20052005

    • 著者名/発表者名
      Yohei Seki, Koji Eguchi, Noriko Kando, Masaki Aono
    • 雑誌名

      Proc.of the Document Understanding Conference Workshop 2005 (DUC 2005)

      ページ: 119-126

  • [雑誌論文] 日本語と英語の文タイプの自動付与とその特徴素2005

    • 著者名/発表者名
      関洋平, 神門典子, 青野雅樹
    • 雑誌名

      電子情報通信学会技術研究報告 言語理解とコミュニケーション研究会 NLC-2005-28 105・299

      ページ: 23-28

  • [雑誌論文] 理由に着目した感情表現の分析2005

    • 著者名/発表者名
      中山記男, 神門典子
    • 雑誌名

      電子情報通信学会技術研究報告 思考と言語研究会 TL-2005 105・291

      ページ: 51-56

  • [図書] "Multi-Document Viewpoint Summarization Focused on Facts, Opinion and Knowledge" Computing Attitude and Affect in Text : Theory and Applications(In Shanahan, J.G., Qu, Y., Wiebe, J.(eds))2005

    • 著者名/発表者名
      Yohei Seki, Koji Eguchi, Noriko Kando
    • 総ページ数
      317-336
    • 出版者
      Springer, The Information Retrieval Series, Vol.20

URL: 

公開日: 2007-04-02   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi