• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実績報告書

数量データに基づくWeb情報の信頼性検証と高信頼情報の生成

研究課題

研究課題/領域番号 18H03244
研究機関筑波大学

研究代表者

加藤 誠  筑波大学, 図書館情報メディア系, 准教授 (00646911)

研究分担者 吉川 正俊  京都大学, 情報学研究科, 教授 (30182736)
山本 祐輔  静岡大学, 情報学部, 講師 (50625431)
大島 裕明  兵庫県立大学, 応用情報科学研究科, 准教授 (90452317)
研究期間 (年度) 2018-04-01 – 2023-03-31
キーワード情報検索 / データマイニング / 数量データ / 信頼性
研究実績の概要

(課題1)数量データの収集とその集約に基づいた数量データの意味づけ: 数量データを大規模に収集し,それらのうち,どの数量データが同一であるのか,包含関係にあるのか,また,ある数量データが別の数量データに対して特定の演算を行った結果であるのかを推定し,数量データに特化したオントロジを自動的に構築した.令和元年度は数量データから同一性と包含関係の判定を大規模に行う方法について取り組み,その成果は論文誌への採録が決定している.この研究では,200億ほどのWebページから5,783,365個の数量を含む表を抽出し,表の列間の関係性から同一性と包含関係の判定を行っている.実験の結果として,19,893個の数値属性の同一性と8,118個の数値属性の包含関係を発見した.
(課題2)数量データと情報の対応付けに基づく情報の信頼性評価: 令和元年度は収集した数量データと宣言的知識を対応づけることを行い,その成果を国際学会にて発表する予定である.この研究では,AはBよりもXである,といった順序に関する文章やAはXである,といった分類を示唆する文章に対する根拠を数量データに求める方法を提案している.特に,数量データの種類数が多い場合であっても精度良く根拠を発見できる方法を提案しており,この点が本研究の技術的貢献である.Webから収集された数量データに基づいて行われた実験では,数量データの種類数が多い場合であっても既存の手法と比べて有意に高い精度で順序に関する文章を説明できることを示している.
(課題3)数量データからの高信頼情報の生成: 作業タスク間の関係性(たとえば,あるタスクの達成に別のタスクが必要になるなど)や作業タスクと情報の関係性を学習する予定であったが,令和元年度においてはこの課題について大きな進展はなかった.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

当初の計画と比較したときに,(課題1)「数量データの収集とその集約に基づいた数量データの意味づけ」,および,(課題2)「数量データと情報の対応付けに基づく情報の信頼性評価」については,非常に順調に進んでおり,一部令和2年度の研究を前倒しで行うことができている.一方で,(課題3)「数量データからの高信頼情報の生成」については,令和元年度において十分な成果を上げていない.総合的に判断した場合には,おおむね順調に進展しているといえる.

今後の研究の推進方策

(課題3)「数量データからの高信頼情報の生成」については,当初の研究計画では作業タスクのみに着目していたが,この内容については,令和元年度においてかなり難しいことがわかってきた.そのため,令和2年度以降には,作業タスクに限らず,数量データからの高信頼情報の生成という課題を広く捉えて取り組んでいきたいと考えている.より具体的には,数量データをより効果的に提示する方法について研究を進めていくことを予定している.

  • 研究成果

    (5件)

すべて 2020

すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (2件) (うち国際学会 2件)

  • [雑誌論文] ゼロショット学習によるテキストからのエンティティプロパティ同定2020

    • 著者名/発表者名
      Wiradee Imrattanatrai, 加藤 誠, 吉川 正俊
    • 雑誌名

      日本データベース学会和文論文誌

      巻: 18-J ページ: -

    • 査読あり
  • [雑誌論文] Searching for Microblogs Referring to Events by Deep Dynamic Query Strategies2020

    • 著者名/発表者名
      Jun-Li Lu, Makoto P. Kato, Takehiro Yamamoto, Katsumi Tanaka
    • 雑誌名

      情報処理学会論文誌データベース(TOD)

      巻: 13(2) ページ: 1882-7799

    • 査読あり
  • [雑誌論文] 表からの量的データ属性間の関係抽出2020

    • 著者名/発表者名
      藤岡 周平, 加藤 誠, 吉川 正俊
    • 雑誌名

      情報処理学会論文誌データベース(TOD)

      巻: 13(3) ページ: -

    • 査読あり
  • [学会発表] Identifying Entity Properties from Text with Zero-shot Learning2020

    • 著者名/発表者名
      Wiradee Imrattanatrai, Makoto P. Kato, Masatoshi Yoshikawa
    • 学会等名
      Proceedings of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval
    • 国際学会
  • [学会発表] Context-guided Learning to Rank Entities2020

    • 著者名/発表者名
      Makoto P. Kato, Wiradee Imrattanatrai, Takehiro Yamamoto, Hiroaki Ohshima, Katsumi Tanaka
    • 学会等名
      Proceedings of the 42nd European Conference on IR Research
    • 国際学会

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi