検索意図と文書特性に基づいて特定の観点から内容をまとめる柔軟な複数文書自動要約
Project/Area Number |
16650053
|
Research Category |
Grant-in-Aid for Exploratory Research
|
Allocation Type | Single-year Grants |
Research Field |
情報図書館学・人文社会情報学
|
Research Institution | National Institute of Informatics |
Principal Investigator |
神門 典子 国立情報学研究所, 情報社会相関研究系, 教授 (80270445)
|
Co-Investigator(Kenkyū-buntansha) |
関 洋平 豊橋技術科学大学, 情報工学系, 助手 (00348468)
|
Project Period (FY) |
2004 – 2006
|
Project Status |
Completed (Fiscal Year 2006)
|
Budget Amount *help |
¥3,300,000 (Direct Cost: ¥3,300,000)
Fiscal Year 2006: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 2005: ¥1,300,000 (Direct Cost: ¥1,300,000)
Fiscal Year 2004: ¥1,300,000 (Direct Cost: ¥1,300,000)
|
Keywords | 複数文書要約 / 主観情報 / 観点 / 意見 / 感情 / 文のタイプ / 要約の評価 / 理由 / 文書ジャンル / 情報のタイプ / 意見の要約 |
Research Abstract |
自動要約研究では,従来,主として文書中の単語の出現頻度を手がかりとして重要な話題を含む箇所を抽出する手法が用いられてきた.しかしながら,たとえ同じ文書集合が与えられたとしても,その中で重視する観点は,個々の利用者の検索の目的によって異なる.観点はさまざまなものが考えられるが,本研究では、(1)話題と利用者が求める情報のタイプ(事実か、意見かなど)、(2)話題と主観情報,特に意見(肯定,否定)に着目した複数文書要約と,(3)感情ならびに感情が生じる理由の分析について研究を行った。 今年度は、(1)(2)の研究をまとめるために、意見要約における,文書の意見性(文書ジャンル),文の意見性,意見句,意見保有者,意見の極性,強度などの意見属性の効果について調べた.DUC2006の英語の要約データセットから意見に関わる15トピックを選択し,上記の属性に着目して要約を作成し、ROUGEとBEを用いて評価した結果、日本語要約の先行研究と同様に,英語の要約でも文タイプと意見性と文書ジャンルの情報を要約のパラメタとして組み合わせることで,条件によっては精度が向上し、意見の強さも精度向上にわずかながら寄与することがわかった.また、これまでの研究成果をより広い範囲で他の研究グループと比較評価し、領域として研究を推進するために、NTCIR-6において日英中の意見分析用コーパスを構築し、意見分析について国内外の15の研究グループと同じデータを用いて研究を進めた。 (3)については、テキスト中に表明された理由の構成要素として「主体」、「対象」、「感情」、「根拠・理由」に着目し、分析した。20名の被験者調査により、他者の意見や他者が表明した感情を自己の行動の選択時に参考にするかどうか(すなわち、他者の表明を信頼するかどうか)は、意見や感情の根拠や理由が示されていることが重要であることをあきらかにした。
|
Report
(3 results)
Research Products
(19 results)
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Book] "Multi-Document Viewpoint Summarization Focused on Facts, Opinion and Knowledge" Computing Attitude and Affect in Text : Theory and Applications(In Shanahan, J.G., Qu, Y., Wiebe, J.(eds))2005
Author(s)
Yohei Seki, Koji Eguchi, Noriko Kando
Publisher
Springer, The Information Retrieval Series, Vol.20
Related Report
-