• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Research-status Report

他者の意見の引用を考慮したオピニオンマイニング

Research Project

Project/Area Number 17K00298
Research InstitutionJapan Advanced Institute of Science and Technology

Principal Investigator

白井 清昭  北陸先端科学技術大学院大学, 先端科学技術研究科, 准教授 (30302970)

Project Period (FY) 2017-04-01 – 2020-03-31
Keywordsオピニオンマイニング / テキストの極性判定 / 自然言語処理
Outline of Annual Research Achievements

本研究課題では、時事問題が与えられたとき、それに対する人々の意見を集約・分析し、わかりやすい形式でユーザに提示する手法を探究する。本年度は、他者の記事の引用を含むブログ記事の極性判定、すなわちブログ記事が時事問題に対して肯定的あるいは否定的意見を述べているかを判定する問題に取り組んだ。提案手法では、昨年度に研究した手法を用いて、まずブログ記事をブロガー自身が書いたテキストと他の記事から引用されたテキストに分割する。次に、ブロガーが書いたテキストの極性、引用されたテキストの極性、および引用関係をそれぞれ解析する。引用関係とは、ブロガーがどのような立場で他の記事を引用したかを表す関係であり、順接(引用した記事に賛成)、逆接(引用した記事に反対)、無関係のいずれかとする。これら3つの解析結果を総合的に判断する27種類のルールによって、ブログ記事全体の極性を決める。例えば、ブロガーのテキストの極性が中立、引用した記事の極性が肯定、引用関係が逆接のとき、ブログ記事全体の極性を否定と判定する。また、ブロガーのテキストの極性が肯定、引用した記事の極性が否定、引用関係が順接とき、ブロガーが書いたテキストの極性と引用したテキストの極性が矛盾しているので、タイブレークのルールを適用する。具体的には、ブロガーのテキストならびに引用されたテキストの極性を強さを比較し、強い方の極性をブログ記事全体の極性と決める。評価実験の結果、提案手法の極性判定の正解率はベースラインを5%程度上回ることを確認した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

他のテキストの引用を含むブログ記事の極性判定については、テキストの極性判定の正解率の向上や引用関係を解析する手法の洗練など、いくつか改良・改善の余地は残されているが、引用を考慮することでブログ記事の極性判定の正解率を向上させることに成功している。したがって、概ね当初の計画通りに進んでいると言える。

Strategy for Future Research Activity

今後の課題として、ブロガーが書いたテキストの極性判定、および引用されたテキストの極性判定の正解率を向上させる。これまでの研究では、時事問題について意見を述べたテキストに極性を付与した訓練データが存在しなかったため、ホテルのレビュー文に極性を付与したデータを訓練データとして極性判定の分類器を学習していたが、訓練データとテストデータのテキストの種類が異なるため、正解率は十分に高いとは言えなかった。そのため、分野適応の手法を応用し、これまでに使用した大量のホテルのレビュー文のデータと、少量の時事問題のテキストに極性を付与したデータを組み合わせることで、極性判定の正解率を向上させる。また、順接、逆接、無関係などの引用関係を解析する技術については、現状ではキーワードのマッチングに基づく手法を用いていたが、機械学習に基づく手法など別の手法も探究する。
次に、与えられた時事問題に対し、複数のテキスト間の引用・被引用関係を可視化した意見グラフを構築する。被引用テキストを中心に、それを引用した記事をその極性(賛成か反対か)とともに二次元空間上に配置し、時事問題に対する意見を俯瞰的に見ることができるグラフを作成する。

Causes of Carryover

物品については、現状の設備で研究を遂行することが十分可能であることがわかり、サーバなどの購入を行わなかったため、次年度使用額が発生した。旅費・その他については、研究発表・資料収集にかかる費用が当初の予定よりも低かったため、次年度使用額が発生した。
今後の使用計画としては、研究の遂行に必要なサーバやPCの購入や、今年度に引き続き研究発表・資料収集のための学会参加の旅費として予算を執行する予定である。

  • Research Products

    (2 results)

All 2019 2018

All Presentation (2 results) (of which Int'l Joint Research: 1 results)

  • [Presentation] 引用関係の解析に基づくテキストの極性判定2019

    • Author(s)
      村松健太, 白井清昭
    • Organizer
      言語処理学会第25回年次大会. pp.1149-1152
  • [Presentation] A Joint Model of Term Extraction and Polarity Classification for Aspect-based Sentiment Analysis2018

    • Author(s)
      Hy Nguyen, Kiyoaki Shirai
    • Organizer
      The 10th International Conference on Knowledge and Systems Engineering. pp.323-328
    • Int'l Joint Research

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi