2022 Fiscal Year Annual Research Report
Credibility Validation of Web Information and Generation of Credible Information based on Quantitative Data
Project/Area Number |
18H03244
|
Research Institution | University of Tsukuba |
Principal Investigator |
加藤 誠 筑波大学, 図書館情報メディア系, 准教授 (00646911)
|
Co-Investigator(Kenkyū-buntansha) |
山本 祐輔 静岡大学, 情報学部, 准教授 (50625431)
大島 裕明 兵庫県立大学, 情報科学研究科, 准教授 (90452317)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | 情報検索 / データマイニング / 数量データ / 信頼性 |
Outline of Annual Research Achievements |
本年度は下記の課題について研究成果をあげた. (課題2)数量データと情報の対応付けに基づく情報の信頼性評価:数量データを引用するテキスト情報と数量データの対応付けを行うことによって,数量データ中の誤り,または,文書中における数値引用の誤りを認識する技術の研究を行った.本年度以前に,数量データの特定の箇所を引用する文をWikipediaから収集しており,このデータセットに基づいて,ある文が参照する数値データを特定する技術を開発した.この方法は,表形式データの各列と各行を引用文と共に事前学習済み言語モデルへ入力し,最も適合度が高い列と行の交点が引用されている箇所であると推定する方法である.本研究内容は国内の学会および論文誌にて発表されている. (課題3)数量データからの高信頼情報の生成:当初の計画は数量データの説明文生成であったが,大規模言語モデルの発展により技術的課題が大きく変化してしまったため,問題設定を大きく変更して本課題に取り組んだ.本年度は,エンティティの特定の性質の多寡を数量データによって説明する方法について研究を行った.提案手法としては,含意関係認識を用いた手法とトピックモデルを用いた手法を採用した.含意関係認識を用いた手法では,エンティティの特定の性質の多寡がある特定の数量データの多寡によって含意されるかを,大規模言語モデルによって推定する.トピックモデルを用いた手法では,数量データによってエンティティの特定の性質の有無を予測するモデルを構築し,予測に大きく貢献する数量データによりエンティティの特定の性質の多寡を説明する.本研究内容は国内の学会にて発表されている.
|
Research Progress Status |
令和4年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和4年度が最終年度であるため、記入しない。
|
Research Products
(5 results)