• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実績報告書

快適なWeb検索のための検索用語の獲得支援に関する研究

研究課題

研究課題/領域番号 25330368
研究機関龍谷大学

研究代表者

馬 青  龍谷大学, 理工学部, 教授 (30358882)

研究分担者 吉見 毅彦  龍谷大学, 理工学部, 准教授 (50368031)
南條 浩輝  京都大学, 学術情報メディアセンター, 准教授 (50388162)
研究期間 (年度) 2013-04-01 – 2017-03-31
キーワード深層学習 / DBN/SdA / 用語予測 / 検索支援 / 非構造化文書 / カテゴリ推定
研究実績の概要

Web検索において検索用語がわからないことに不満を感じる人は57.6%に上る。提案研究はこのような不満を軽減し、快適な検索ができるように検索用語をその説明文または関連語・周辺語を用いて獲得する手法の研究開発を目的としている。
前年度までは深層学習を用いた検索用語の予測手法を提案た。深層学習としてDBNに加えSdAを用いた。汎化能力を高めるためにDropoutなどの正則化を導入した。「USBメモリ」のような複数の用語からなる複合語的な検索用語も扱えるように、より柔軟な予測を実現できた。また、提案手法は検索用語の予測に数多くの関連語・周辺語を必要とするのではなく、2,3個の関連語・周辺語さえあればある程度精度の高い用語予測ができるという、現実的な支援ができることも確認した。今年度では、精度の高い(しかし人手収集が必要つまりコストの高い)ラベル付き学習データに加え、ノイズの多い、Webから自動収集した大規模なラベルなしデータを用いることにより深層学習の用語予測精度をさらに向上させ、提案手法をより実用的なものにした。また、深層学習の構造と予測精度の関連性を、本課題の用語予測のみならず本課題の応用研究として進めているQAサイトの質問文のカテゴリ推定においても、系統的に解析を進め今後の研究に役立つ知見が得られた。
また、本研究の拡張として、引き続き、「見出し語とその説明」という構造が含まれない文書(非構造化文書)からの用語獲得の研究を推進した。クエリと最も近い文書中の一部(パッセージ)を検索し、そのパッセージに含まれる語を用語候補とする方法を研究した。さらに、出力された用語候補の絞り込み、および、用語候補らしさのスコアをより適切なものに補正する手法の研究、クエリの有効利用にも取り組んだ。
上記研究成果は学術雑誌論文1編、国際会議論文1編、国内会議論文4編で発表した。

  • 研究成果

    (6件)

すべて 2017 2016

すべて 雑誌論文 (1件) (うち査読あり 1件、 謝辞記載あり 1件) 学会発表 (5件) (うち国際学会 1件)

  • [雑誌論文] 音声ドキュメントを検索対象とした用語検索2017

    • 著者名/発表者名
      森田直樹,南條浩輝,山本凌紀,馬青
    • 雑誌名

      情報処理学会論文誌(テクニカルノート)

      巻: Vol.58, No.3 ページ: 762-767

    • 査読あり / 謝辞記載あり
  • [学会発表] 機械学習を用いたQAサイト質問文のカテゴリの類推2017

    • 著者名/発表者名
      加藤 玲大,馬青,村田真樹
    • 学会等名
      言語処理学会第23回年次大会
    • 発表場所
      筑波大学(筑波キャンパス 春日エリア)
    • 年月日
      2017-03-14 – 2017-03-16
  • [学会発表] 複数の入力説明文を用いた音声ドキュメントからの用語検索2017

    • 著者名/発表者名
      森田直樹,南條浩輝,馬青
    • 学会等名
      言語処理学会第23回年次大会
    • 発表場所
      筑波大学(筑波キャンパス 春日エリア)
    • 年月日
      2017-03-14 – 2017-03-16
  • [学会発表] Retrieval Term Prediction Using Deep Learning Methods2016

    • 著者名/発表者名
      Qing Ma, Ibuki Tanigawa and Masaki Murata
    • 学会等名
      The 30th Pacific Asia Conference on Language, Information and Computation (Paclic 30)
    • 発表場所
      Seoul
    • 年月日
      2016-10-28 – 2016-10-30
    • 国際学会
  • [学会発表] 深層学習を用いた QA サイト質問文のカテゴリ分類2016

    • 著者名/発表者名
      加藤玲大,馬青,村田真樹
    • 学会等名
      情報処理学会研究報告 Vol. 2016-NL-228
    • 発表場所
      大阪大学(吹田キャンパス)
    • 年月日
      2016-09-29 – 2016-09-30
  • [学会発表] 非構造化文書からの用語検索における用語候補のリスコアリングの検討2016

    • 著者名/発表者名
      森田直樹,南條浩輝,馬青
    • 学会等名
      情報処理学会研究報告 SLP-111/NL-226
    • 発表場所
      東京工業大学(大岡山キャンパス)
    • 年月日
      2016-05-16 – 2016-05-17

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi