• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2019 Fiscal Year Annual Research Report

Research on Analysis and Visualization of News Site Stances based on the Comparison of Multiple News Sites

Research Project

Project/Area Number 18H03338
Research InstitutionHokkaido University

Principal Investigator

吉岡 真治  北海道大学, 情報科学研究院, 教授 (40290879)

Co-Investigator(Kenkyū-buntansha) 伊藤 正彦  北海道情報大学, 情報メディア学部, 准教授 (60466422)
神門 典子  国立情報学研究所, 情報社会相関研究系, 教授 (80270445)
Project Period (FY) 2018-04-01 – 2022-03-31
Keywordsテキストマイニング / 報道分析 / 可視化 / オピニオンマイニング / オントロジー
Outline of Annual Research Achievements

本年度は、昨年度までに提案した、ニュースの記事分類(政治・経済・国際など)ごとを考慮した賛否の分布スタンスの分布により特徴付けられたニュースサイト群について、その類似性・非類似性に基づいて可視化する方法を提案するとともに、ユーザの興味(経済には興味はあるが国際には興味がない)により、その可視化の結果をインタラクティブに操作するニュースサイトの比較システムの提案を行った。
このシステムで分析を行うためには、各ニュースサイトの記事について、記事分類を行う必要がある。この問題に対し、ニュース記事のURLの構造に注目し、深層学習を用いて記事分類を行う方法を提案し、本文のテキスト情報を有しないGDELTのデータを用いても、十分な記事分類が行えることを確認した。
また、このインタラクティブな操作を行うニュースサイトの比較システムでは、自分が類似しているというサイトを近くに配置し、非類似と考えるサイトを遠くに配置するといった操作から、どの記事分類の違いを重要視しているか(あるいは無視しているのか)を推定するとともに、その分析結果のフィードバックを返すとともに、直接操作していない他のニュースサイトについても、その興味に応じて再プロットすることができる。この結果、国際的な事象に興味があるユーザと国内の政治への興味が近いユーザには、異なる分析結果を提供することが可能になる。
また、ニュース記事中の固有名詞とそのタイプを扱うために、Wikipediaのカテゴリ情報に注目した名前付き実体の分類のためのオントロジー構築についても、並行して研究を行なっている。このオントロジーとWikipediaのページのリダイレクトの情報を利用した異表記に関する知識を作成することで、名前付き実体の異表記を取りまとめて扱う方法についても検討を行なっている。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本年度は、昨年度提案したニュース記事の分類とその賛否に基づいたスタンスを用いて、ニュースサイトを可視化するとともに、ユーザの興味に応じてインタラクティブに可視化結果を変更することができるニュースサイトの比較分析システムを提案した。このシステムは、本研究の最終目標に対するプロトタイプシステムであり、今後の要素技術の改善や利用実験を行なって行く際の基盤となる。また、本研究で利用するGDELTのデータの品質向上のための研究として、ニュースの記事分類を自動付与する方法やオントロジー構築についても検討しており、今後のデータの洗練化につなげていきたいと考えている。 今後は、要素技術の洗練化を図るとともに、実際のニュースの分析実験を行い、システムの有用性について検討して行く予定である。

Strategy for Future Research Activity

本研究では、要素技術を情報科学の観点から洗練化することも重要であるが、その評価の枠組についての検討を並行して行って行く必要がある。現時点で作成したシステムについて、情報システムとしての挙動については、問題ないことを確認しているが、結果を解釈するためには、各ニュースサイトがどのようなサイトであり、各々の話題についてどういうスタンスを持っているのか、といった基礎知識を持つか、表示結果に基づいて、特徴的なニュースサイト群について、その共通性や非類似性がユーザの興味にあっているかといった比較をして行く必要がある。メディアのバイアスについて紹介しているWebサイトなどの情報も活用しながら、本システムの有用性をどのように評価して行くのかを検討することが重要であると考えている。

  • Research Products

    (10 results)

All 2020 2019 Other

All Int'l Joint Research (1 results) Journal Article (4 results) (of which Int'l Joint Research: 2 results,  Peer Reviewed: 4 results,  Open Access: 1 results) Presentation (5 results)

  • [Int'l Joint Research] University of Massachusetts, Amherst(米国)

    • Country Name
      U.S.A.
    • Counterpart Institution
      University of Massachusetts, Amherst
  • [Journal Article] COLIEE-2018: Evaluation of the Competition on Legal Information Extraction and Entailment2019

    • Author(s)
      Kano Yoshinobu、Kim Mi-Young、Yoshioka Masaharu、Lu Yao、Rabelo Juliano、Kiyota Naoki、Goebel Randy、Satoh Ken
    • Journal Title

      ew Frontiers in Artificial Intelligence. JSAI-isAI 2018. Lecture Notes in Computer Science

      Volume: 11717 Pages: 177~192

    • DOI

      10.1007/978-3-030-31605-1_14

    • Peer Reviewed
  • [Journal Article] COLIEE 2019 Overview2019

    • Author(s)
      Juliano Rabelo, Mi-Young Kim, Randy Goebel, Masaharu Yoshioka, Yoshinobu Kano and Ken Satoh
    • Journal Title

      roceedigns of the Sixth International Competition on Legal Information Extraction/Entailment (COLIEE 2019)

      Volume: - Pages: 1-9

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] HUKB at COLIEE 2019 Information Retrieval Task - Utilization of metadata for relevant case retrieval -2019

    • Author(s)
      Masaharu Yoshioka and Zihao Song
    • Journal Title

      roceedigns of the Sixth International Competition on Legal Information Extraction/Entailment (COLIEE 2019)

      Volume: - Pages: 33-37

    • Peer Reviewed
  • [Journal Article] Stance or insults?2019

    • Author(s)
      Simona Frenda, Noriko Kando, Viviana Patti and Paolo Rosso
    • Journal Title

      Proceedings of the Ninth International Workshop on Evaluating Information Access (EVIA 2019), a Satellite Workshop of the NTCIR-14 Conference

      Volume: - Pages: 15-22

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Presentation] ユーザの興味を反映したニュースサイトの多観点スタンス分析2020

    • Author(s)
      立浪紀彦, 吉岡真治, 神門典子, James Allan, 伊藤正彦
    • Organizer
      言語処理学会第26回年次大会発表論文集, D5-4
  • [Presentation] NTCIR-15 QA Lab-PoliInfo2 のタスク設計2020

    • Author(s)
      木村泰知, 渋木英潔, 高丸圭一, 秋葉友良, 石下円香, 内田ゆず, 小川泰弘, 乙武北斗, 佐々木稔, 三田村照子, 横手健一, 吉岡真治, 神門典子
    • Organizer
      言語処理学会第26回年次大会発表論文集, F3-2
  • [Presentation] 森羅と日本語DBpediaにおける属性の取り扱いに関する比較分析2020

    • Author(s)
      小板橋佳晃,吉岡真治
    • Organizer
      言語処理学会第26回年次大会発表論文集, D5-1
  • [Presentation] カテゴリの親子関係の種類に基づくWikipediaカテゴリの再整理2019

    • Author(s)
      中川嵩教,小板橋佳晃,吉岡真治
    • Organizer
      2019年度人工知能学会全国大会(第33回)論文集, 1K2-J-4-05
  • [Presentation] 日本語Wikipediaオントロジーの構築2019

    • Author(s)
      中川嵩教,小板橋佳晃,吉岡真治
    • Organizer
      人工知能学会第48回セマンティックウェブとオントロジー研究会, SIG-SWO-048-07

URL: 

Published: 2021-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi