• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Annual Research Report

Credibility Validation of Web Information and Generation of Credible Information based on Quantitative Data

Research Project

Project/Area Number 18H03244
Research InstitutionUniversity of Tsukuba

Principal Investigator

加藤 誠  筑波大学, 図書館情報メディア系, 准教授 (00646911)

Co-Investigator(Kenkyū-buntansha) 山本 祐輔  静岡大学, 情報学部, 准教授 (50625431)
大島 裕明  兵庫県立大学, 情報科学研究科, 准教授 (90452317)
Project Period (FY) 2018-04-01 – 2023-03-31
Keywords情報検索 / データマイニング / 数量データ / 信頼性
Outline of Annual Research Achievements

(課題1)数量データの収集とその集約に基づいた数量データの意味づけ:令和3年度には数量データを引用するテキスト情報と対応付けることによって,数量データ中の誤り,および,文書中における数値引用の誤りを認識するというタスクに取り組んだ.Wikipediaの日英記事の中からe-Statなどの統計ポータルサイト中のデータを引用していると思われる箇所を自動的に特定した上で,クラウドソーシングによって実際に引用しているかどうかを判定した.このようにして構築されたデータセットを用いて,本年度は基礎的なアルゴリズムの評価を行った.

(課題2)数量データと情報の対応付けに基づく情報の信頼性評価:Web上に記述されている情報を導出するような数量データを特定することを目的として,令和3年度には,数量データと情報の対応付けを行うための新たなテストコレクションを構築した.また令和2年度と同様に, NTCIR-16 Data Search 2という評価キャンペーンを運営した.これらの成果に基づいて,数量データと情報の対応付けを行うためのアルゴリズムについて分析を行い,国際会議論文としてまとめ本年度にて対外発表を行っている.

(課題3)数量データからの高信頼情報の生成:令和3年度は,表形式データの自動的理解,有用な数量データの視覚表現を生成する方法,および,論文中の表に基づいて説明文を生成するという課題について取り組んだ.どの課題についても令和2年度から継続して実施したものであり,本年度において国際学会および論文誌にて成果発表を行った.

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

当初の計画と比較し,(課題1)「数量データの収集とその集約に基づいた数量データの意味づけ」,および,(課題2)「数量データと情報の対応付けに基づく情報の信頼性評価」については,令和4年度までの目標をおおむね達成できていると思われる.一方で,(課題3)「数量データからの高信頼情報の生成」については,令和2年度開始の時点で作業タスクの関係性に関する研究を中断することを計画しているため,当初の計画どおりとは言い難いものの, 形式データの自動的理解,有用な数量データの視覚表現を生成する方法,および,論文中の表に基づく説明文生成という3つの研究について成果を挙げられているため,順調に進んでいると思われる.

Strategy for Future Research Activity

令和4年度までの目標をおおむね達成できていると思われるため,これまでに得られた研究成果をより発展させ,検索システムの信頼性に関する問題について,多面的に取り組んでいきたいと考えている.

  • Research Products

    (6 results)

All 2022 2021

All Journal Article (4 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 4 results) Presentation (2 results)

  • [Journal Article] A Test Collection for Ad-hoc Dataset Retrieval2021

    • Author(s)
      Makoto P. Kato, Hiroaki Ohshima, Ying-Hsang Liu, Hsin-Liang Chen
    • Journal Title

      Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval

      Volume: - Pages: 2450-2456

    • DOI

      10.1145/3404835.3463261

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Table Caption Generation in Scholarly Documents Leveraging Pre-trained Language Models2021

    • Author(s)
      Junjie H. Xu, Kohei Shinden, Makoto P. Kato
    • Journal Title

      Proceedings of the 2021 IEEE 10th Global Conference on Consumer Electronics (GCCE 2021)

      Volume: - Pages: 963-966

    • DOI

      10.1109/GCCE53005.2021.9621890

    • Peer Reviewed
  • [Journal Article] Intent-aware Visualization Recommendation for Tabular Data2021

    • Author(s)
      Atsuki Maruta, Makoto P. Kato
    • Journal Title

      Proceedings of the 22nd International Conference on Web Information Systems Engineering (WISE 2021)

      Volume: - Pages: 252-266

    • DOI

      10.1007/978-3-030-91560-5_18

    • Peer Reviewed
  • [Journal Article] クエリと文書のフィールドを考慮した被引用統計データの検索2021

    • Author(s)
      中野 優, 加藤 誠
    • Journal Title

      情報処理学会論文誌データベース(TOD)

      Volume: 14 Pages: 49-60

    • Peer Reviewed
  • [Presentation] 統計データ収集のためのフォーカストクローラ2022

    • Author(s)
      和久井 拓斗, 加藤 誠
    • Organizer
      第14回データ工学と情報マネジメントに関するフォーラム (DEIM 2022)
  • [Presentation] 被引用統計データのセル特定データセットの構築2022

    • Author(s)
      中野 優, 加藤 誠
    • Organizer
      第14回データ工学と情報マネジメントに関するフォーラム (DEIM 2022)

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi