• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2018 年度 実績報告書

数量データに基づくWeb情報の信頼性検証と高信頼情報の生成

研究課題

研究課題/領域番号 18H03244
研究機関京都大学

研究代表者

加藤 誠  京都大学, 国際高等教育院, 特定講師 (00646911)

研究分担者 大島 裕明  兵庫県立大学, 応用情報科学研究科, 准教授 (90452317)
山本 祐輔  静岡大学, 情報学部, 講師 (50625431)
山本 岳洋  京都大学, 情報学研究科, 助教 (70717636)
研究期間 (年度) 2018-04-01 – 2023-03-31
キーワード情報検索 / データマイニング / 数量データ / 信頼性
研究実績の概要

【数量データの収集とその集約に基づいた数量データの意味づけ】
数量データを大規模に収集するために,深層強化学習を用いたデータクローラを開発した.教科学習の報酬としてデータの発見の有無を,行動としてどのページへ遷移するかを設定し,長期的な報酬に基づいてリンクを選択的にたどるようなクローラを作成した.平成30年度の段階ではまだ実用には至っていないが,実験においては,これまで提案されていたオンライン学習に基づくクローラよりも高い効率を達成できることを確認している.また,Webから収集された400万件の表データから同一属性や上位下位関係を特定する方法について研究を行った.同一属性の判定には同一実体に対する属性値の一致度を用い,上位下位関係の判定には表の構造と属性値の関係性を用いる.

【数量データと情報の対応付けに基づく情報の信頼性評価】
Webページに記述されている内容と構造化された知識の対応づけをゼロショット学習の設定下において実現する方法を提案した.この提案手法では,訓練データに出現しないような知識であってもWebページ上の記述と対応づけることが可能であり,この方法によって,より広い範囲の知識とWeb上の記述を対応づけることが可能になった.提案モデルとしては,双方向LSTMによってWeb上の記述を特徴付け,それと知識ベース中のパスをグラフ埋め込みによって表現したものとの類似度を計算し,高い類似度を与えるようなパスがその記述に対応するとしている.また,「古い」や「長い」といったある特定の属性と関係が強い単語から,それが意味する属性値を推定する方法についても研究を行った.この方法では,単語と属性名の類似度に加えて,その単語と属性名が共起するかどうか,また,単語の有無によって属性値の分布が著しく変化するかどうかによって,単語と属性間の対応関係の強さを測った.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

「(課題3)数量データからの高信頼情報の生成」については大きな進展はなかったものの,「(課題1)数量データの収集とその集約に基づいた数量データの意味づけ」,および,「(課題2)数量データと情報の対応付けに基づく情報の信頼性評価」については想定以上に研究が進んでいる.

今後の研究の推進方策

(課題1)数量データの収集とその集約に基づいた数量データの意味づけ: 平成31年度は主に平成30年度に収集した数量データから同一性と包含関係の判定を大規模に行 う方法について取り組む.
(課題2)数量データと情報の対応付けに基づく情報の信頼性評価: 平成31年度は主に平成30年度に収集した数量データから宣言的知識と数量データを対応づけることを目標とする.
(課題3)数量データからの高信頼情報の生成: 平成31年度は検索行動ログから関係性を発見する方法について取り組む.

  • 研究成果

    (4件)

すべて 2019 2018

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (3件)

  • [雑誌論文] Entity Ranking for Queries with Modifiers Based on Knowledge Bases and Web Search Results2018

    • 著者名/発表者名
      IMRATTANATRAI Wiradee、KATO Makoto P.、TANAKA Katsumi、YOSHIKAWA Masatoshi
    • 雑誌名

      IEICE Transactions on Information and Systems

      巻: E101.D ページ: 2279~2290

    • DOI

      10.1587/transinf.2017EDP7372

    • 査読あり
  • [学会発表] ゼロショット学習によるテキストからのエンティティプロパティ同定2019

    • 著者名/発表者名
      Wiradee Imrattanatrai,加藤 誠,吉川 正俊
    • 学会等名
      第11回データ工学と情報マネジメントに関するフォーラム
  • [学会発表] 飲食店レビューにおける再訪問ユーザの行動の分析2019

    • 著者名/発表者名
      白髪 宙海, 村本 直樹, 高橋 克郎, 大島 裕明
    • 学会等名
      第11回データ工学と情報マネジメントに関するフォーラム
  • [学会発表] 食べログの再訪問レビューの発見2018

    • 著者名/発表者名
      白髪 宙海, 村本 直樹, 大島 裕明
    • 学会等名
      第11回Webとデータベースに関するフォーラム

URL: 

公開日: 2019-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi