• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実施状況報告書

快適なWeb検索のための検索用語の獲得支援に関する研究

研究課題

研究課題/領域番号 25330368
研究機関龍谷大学

研究代表者

馬 青  龍谷大学, 理工学部, 教授 (30358882)

研究分担者 吉見 毅彦  龍谷大学, 理工学部, 准教授 (50368031)
南條 浩輝  京都大学, 学術情報メディアセンター, 准教授 (50388162)
研究期間 (年度) 2013-04-01 – 2017-03-31
キーワード深層学習 / DBN/SdA / 用語予測 / 検索支援 / 非構造化文書 / カテゴリ推定 / 辞書拡充
研究実績の概要

Web検索において検索用語がわからないことに不満を感じる人は57.6%に上る。提案研究はこのような不満を軽減し、快適な検索ができるように検索用語をその説明文または関連語・周辺語を用いて獲得する手法の研究開発を目的としている。
前年度までは深層学習を用いた検索用語の予測手法を提案し、従来の機械学習との比較実験によりその有効性を確認した。今年度では、用語の説明文または関連語・周辺語からのベクトル変換に改良を加えることにより、「USBメモリ」のような複数の用語からなる複合語的な検索用語も扱えるように、より柔軟な予測を実現できた。また、提案手法は検索用語の予測に数多くの関連語・周辺語を必要とするのではなく、2,3個の関連語・周辺語さえあればある程度精度の高い用語予測ができるという、現実的な支援ができることも確認した。さらに、有意差検定を導入し、提案手法の有効性を検証した。
また、本研究の拡張として、引き続き、「見出し語とその説明」という構造が含まれない文書(非構造化文書)からの用語獲得の研究を推進した。クエリと最も近い文書中の一部(パッセージ)を検索し、そのパッセージに含まれる語を用語候補とし、それらの絞り込み、および用語候補らしさのスコアをより適切なものに補正する手法を提案した。
さらに、本研究の要素技術として、検索用語の説明文を解析するために必要な辞書を拡充することに利用できる手法を開発した。また、本研究の応用として、教えて!gooの利用者支援として、質問者が書いた質問文章に関するカテゴリの自動推定の研究を行い、良好な結果が得られた。
上記研究成果は学術雑誌論文2編、国際会議発表1件、国内会議論文2編で発表した。また、すでに確定した国内会議論文1編を発表する予定のほか、国内会議と国際会議と学術雑誌への論文投稿を準備中である。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本研究に携わる一定数の大学院生を確保でき、参加者全員が意欲的に研究に取り組んできたため、おおむね計画通りに本研究を進展させることができた。

今後の研究の推進方策

これまで用語獲得の基本手法を確立することができ、非構造化文書からの用語獲得の研究も進展した。また、その関連研究としてカテゴリ推定の研究も始めた。今後は、研究計画に沿って、言い換えや意味処理を用いた同義語や表記ゆれといった表現の多様性問題を対処するとともに、カテゴリ推定と非構造化文書からの用語獲得の研究を引き続き推進する。また、これまでは分野限定の研究開発を行ってきたので、各分野の検索用語予測を統合する技術、つまり、ユーザの入力を特定の分野に分類する技術の開発も行う予定である。

次年度使用額が生じた理由

提案研究関連の国際会議参加や学術交流のための海外出張用に旅費の予算を計上したが、代表者が海外の研究者から費用全額負担の招待を受けたため、その分の科研費を使わなかったため。

次年度使用額の使用計画

海外向けへの研究成果発信をより活発化させ、そのためにその「次年度使用額」を活用する予定

  • 研究成果

    (5件)

すべて 2016 2015

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 1件、 謝辞記載あり 1件) 学会発表 (3件) (うち国際学会 1件)

  • [雑誌論文] Deep Belief Netwokrを用いた検索用語の予測2015

    • 著者名/発表者名
      馬青,谷河息吹,村田真樹
    • 雑誌名

      自然言語処理

      巻: Vol. 22, No. 4 ページ: 225-250

    • DOI

      http://doi.org/10.5715/jnlp.22.225

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] 既存対訳辞書と複数のシソーラスを用いた類義表現の生成による対訳辞書の拡充2015

    • 著者名/発表者名
      吉見毅彦,小谷克則
    • 雑誌名

      Information

      巻: Vol.18,No.2 ページ: 609-624

    • 査読あり
  • [学会発表] 非構造化文書からの用語検索における用語候補のリスコアリングの検討2016

    • 著者名/発表者名
      森田直樹,南條浩輝,馬青
    • 学会等名
      情報処理学会研究報告 SLP-111/NL-226
    • 発表場所
      東京工業大学(大岡山キャンパス)
    • 年月日
      2016-05-16 – 2016-05-17
  • [学会発表] 説明文を入力とした非構造化文書からの用語検索の検討2015

    • 著者名/発表者名
      森田直樹,南條浩輝,山本凌紀,馬青
    • 学会等名
      情報処理学会研究報告 SLP-109
    • 発表場所
      名古屋工業大学
    • 年月日
      2015-12-02 – 2015-12-03
  • [学会発表] Comparison between Deep Learning and Conventional Machine Learning Methods on Retrieval Term Prediction2015

    • 著者名/発表者名
      Qing Ma
    • 学会等名
      The 15th China-Japan Joint Conference on Natural Language Processing (CJCNLP2015)
    • 発表場所
      Aomori, Japan
    • 年月日
      2015-10-18 – 2015-10-19
    • 国際学会

URL: 

公開日: 2017-01-06  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi