Credibility Validation of Web Information and Generation of Credible Information based on Quantitative Data
Project/Area Number |
18H03244
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Basic Section 60080:Database-related
|
Research Institution | University of Tsukuba (2019-2022) Kyoto University (2018) |
Principal Investigator |
加藤 誠 筑波大学, 図書館情報メディア系, 准教授 (00646911)
|
Co-Investigator(Kenkyū-buntansha) |
山本 祐輔 静岡大学, 情報学部, 准教授 (50625431)
大島 裕明 兵庫県立大学, 情報科学研究科, 准教授 (90452317)
吉川 正俊 京都大学, 情報学研究科, 教授 (30182736)
山本 岳洋 京都大学, 情報学研究科, 助教 (70717636)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥17,030,000 (Direct Cost: ¥13,100,000、Indirect Cost: ¥3,930,000)
Fiscal Year 2022: ¥2,860,000 (Direct Cost: ¥2,200,000、Indirect Cost: ¥660,000)
Fiscal Year 2021: ¥2,860,000 (Direct Cost: ¥2,200,000、Indirect Cost: ¥660,000)
Fiscal Year 2020: ¥2,860,000 (Direct Cost: ¥2,200,000、Indirect Cost: ¥660,000)
Fiscal Year 2019: ¥2,990,000 (Direct Cost: ¥2,300,000、Indirect Cost: ¥690,000)
Fiscal Year 2018: ¥5,460,000 (Direct Cost: ¥4,200,000、Indirect Cost: ¥1,260,000)
|
Keywords | 情報検索 / データマイニング / 数量データ / 信頼性 |
Outline of Annual Research Achievements |
(課題1)数量データの収集とその集約に基づいた数量データの意味づけ:令和3年度には数量データを引用するテキスト情報と対応付けることによって,数量データ中の誤り,および,文書中における数値引用の誤りを認識するというタスクに取り組んだ.Wikipediaの日英記事の中からe-Statなどの統計ポータルサイト中のデータを引用していると思われる箇所を自動的に特定した上で,クラウドソーシングによって実際に引用しているかどうかを判定した.このようにして構築されたデータセットを用いて,本年度は基礎的なアルゴリズムの評価を行った.
(課題2)数量データと情報の対応付けに基づく情報の信頼性評価:Web上に記述されている情報を導出するような数量データを特定することを目的として,令和3年度には,数量データと情報の対応付けを行うための新たなテストコレクションを構築した.また令和2年度と同様に, NTCIR-16 Data Search 2という評価キャンペーンを運営した.これらの成果に基づいて,数量データと情報の対応付けを行うためのアルゴリズムについて分析を行い,国際会議論文としてまとめ本年度にて対外発表を行っている.
(課題3)数量データからの高信頼情報の生成:令和3年度は,表形式データの自動的理解,有用な数量データの視覚表現を生成する方法,および,論文中の表に基づいて説明文を生成するという課題について取り組んだ.どの課題についても令和2年度から継続して実施したものであり,本年度において国際学会および論文誌にて成果発表を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
当初の計画と比較し,(課題1)「数量データの収集とその集約に基づいた数量データの意味づけ」,および,(課題2)「数量データと情報の対応付けに基づく情報の信頼性評価」については,令和4年度までの目標をおおむね達成できていると思われる.一方で,(課題3)「数量データからの高信頼情報の生成」については,令和2年度開始の時点で作業タスクの関係性に関する研究を中断することを計画しているため,当初の計画どおりとは言い難いものの, 形式データの自動的理解,有用な数量データの視覚表現を生成する方法,および,論文中の表に基づく説明文生成という3つの研究について成果を挙げられているため,順調に進んでいると思われる.
|
Strategy for Future Research Activity |
令和4年度までの目標をおおむね達成できていると思われるため,これまでに得られた研究成果をより発展させ,検索システムの信頼性に関する問題について,多面的に取り組んでいきたいと考えている.
|
Report
(4 results)
Research Products
(37 results)
-
-
-
[Journal Article] A Test Collection for Ad-hoc Dataset Retrieval2021
Author(s)
Makoto P. Kato, Hiroaki Ohshima, Ying-Hsang Liu, Hsin-Liang Chen
-
Journal Title
Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 2021)
Volume: -
Pages: 2450-2456
DOI
Related Report
Peer Reviewed / Int'l Joint Research
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] Uhai at the NTCIR-15 Data Search Task2020
Author(s)
Ryota Mibayashi, Huulong Pham, Naoaki Matsumoto, Takehiro Yamamoto and Hiroaki Ohshima
Organizer
Proceedings of the 15th NTCIR Conference on Evaluation of Information Access Technologies (NTCIR-15)
Related Report
Int'l Joint Research
-
-
-
-
-
-