2019 Fiscal Year Annual Research Report
Credibility Validation of Web Information and Generation of Credible Information based on Quantitative Data
Project/Area Number |
18H03244
|
Research Institution | University of Tsukuba |
Principal Investigator |
加藤 誠 筑波大学, 図書館情報メディア系, 准教授 (00646911)
|
Co-Investigator(Kenkyū-buntansha) |
吉川 正俊 京都大学, 情報学研究科, 教授 (30182736)
山本 祐輔 静岡大学, 情報学部, 講師 (50625431)
大島 裕明 兵庫県立大学, 応用情報科学研究科, 准教授 (90452317)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | 情報検索 / データマイニング / 数量データ / 信頼性 |
Outline of Annual Research Achievements |
(課題1)数量データの収集とその集約に基づいた数量データの意味づけ: 数量データを大規模に収集し,それらのうち,どの数量データが同一であるのか,包含関係にあるのか,また,ある数量データが別の数量データに対して特定の演算を行った結果であるのかを推定し,数量データに特化したオントロジを自動的に構築した.令和元年度は数量データから同一性と包含関係の判定を大規模に行う方法について取り組み,その成果は論文誌への採録が決定している.この研究では,200億ほどのWebページから5,783,365個の数量を含む表を抽出し,表の列間の関係性から同一性と包含関係の判定を行っている.実験の結果として,19,893個の数値属性の同一性と8,118個の数値属性の包含関係を発見した. (課題2)数量データと情報の対応付けに基づく情報の信頼性評価: 令和元年度は収集した数量データと宣言的知識を対応づけることを行い,その成果を国際学会にて発表する予定である.この研究では,AはBよりもXである,といった順序に関する文章やAはXである,といった分類を示唆する文章に対する根拠を数量データに求める方法を提案している.特に,数量データの種類数が多い場合であっても精度良く根拠を発見できる方法を提案しており,この点が本研究の技術的貢献である.Webから収集された数量データに基づいて行われた実験では,数量データの種類数が多い場合であっても既存の手法と比べて有意に高い精度で順序に関する文章を説明できることを示している. (課題3)数量データからの高信頼情報の生成: 作業タスク間の関係性(たとえば,あるタスクの達成に別のタスクが必要になるなど)や作業タスクと情報の関係性を学習する予定であったが,令和元年度においてはこの課題について大きな進展はなかった.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の計画と比較したときに,(課題1)「数量データの収集とその集約に基づいた数量データの意味づけ」,および,(課題2)「数量データと情報の対応付けに基づく情報の信頼性評価」については,非常に順調に進んでおり,一部令和2年度の研究を前倒しで行うことができている.一方で,(課題3)「数量データからの高信頼情報の生成」については,令和元年度において十分な成果を上げていない.総合的に判断した場合には,おおむね順調に進展しているといえる.
|
Strategy for Future Research Activity |
(課題3)「数量データからの高信頼情報の生成」については,当初の研究計画では作業タスクのみに着目していたが,この内容については,令和元年度においてかなり難しいことがわかってきた.そのため,令和2年度以降には,作業タスクに限らず,数量データからの高信頼情報の生成という課題を広く捉えて取り組んでいきたいと考えている.より具体的には,数量データをより効果的に提示する方法について研究を進めていくことを予定している.
|
Research Products
(5 results)