• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実施状況報告書

快適なWeb検索のための検索用語の獲得支援に関する研究

研究課題

研究課題/領域番号 25330368
研究機関龍谷大学

研究代表者

馬 青  龍谷大学, 理工学部, 教授 (30358882)

研究分担者 吉見 毅彦  龍谷大学, 理工学部, 准教授 (50368031)
南條 浩輝  龍谷大学, 理工学部, 助教 (50388162)
研究期間 (年度) 2013-04-01 – 2017-03-31
キーワード深層学習 / DBN/SdA/word2vec / 用語予測 / 検索支援 / 関連語・周辺語 / 意味ベクトル / 非構造化文書 / 擬似適合性フィードバック
研究実績の概要

Web検索において検索用語がわからないことに不満を感じる人は57.6%に上る。提案研究はこのような不満を軽減し、快適な検索ができるように検索用語をその説明文または関連語・周辺語を用いて獲得する手法の研究開発を目的としている。
初年度では深層学習(Deep Learning)の一種であるDBNを用いた検索用語の予測手法を提案し、小規模な実験では従来の機械学習手法より有効であることを確認した。今年度では、DBNに加えSdAを用いた深層学習も実現し、実験規模を10倍に拡大して、提案手法の有効性を確認した。また、深層学習を用いた提案手法では、自動で収集したノイズの多い教師なしデータを用いても検索用語の予測精度が向上することが確認でき、有効な学習データの自動獲得についての知見が得られた。さらに、汎化能力を高めるためにDropoutなどの正則化を加えた実験も行い提案手法のほうが従来手法より優位であることを確認した。
提案研究関連の要素技術の研究として、深層学習の一種であるword2vecをを用いたIT用語の意味ベクトルの獲得に関する研究も行った。教師なしの学習データとして大量な文章(または文)を用いる代わりに大規模なNグラムデータを用いることを提案し、その有効性を確認した。また、「見出し語とその説明」という構造が含まれない文書(非構造化文書)からの用語獲得の研究にも取り組んだ。具体的には、クエリと最も近い文書中の一部(パッセージ)を精度よく検索し、そのパッセージに含まれる語を用語候補とする方法に取り組んだ。非構造化文書の一例として音声ドキュメントを採用し、パッセージ検索に基づく擬似適合性フィードバックにおける関連語抽出技術を用語検索に応用して、その可能性を検討した。
上記研究成果は国際会議論文2編と国内会議論文3編を発表したほか、学術雑誌への論文投稿も行った。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

本研究の参加者はたいへん意欲的に研究に取り組み、加えてPythonやC++などのプログラミング力も高かったため、計画以上に研究を進展させることができた。

今後の研究の推進方策

初年度と次年度で用語検索の基本手法を確立することができた。今後は、研究計画に沿って、言い換えや意味処理を用いた同義語や表記ゆれといった表現の多様性問題への対応と、非構造化文書への検索対象の拡大などに取り組むとともに、提案研究の要素技術の研究も行う。また、これまでは分野限定の研究開発を行ってきているので、各分野の検索用語予測を統合する技術、つまり、ユーザの入力を特定の分野に分類する技術の開発も行う予定である。

次年度使用額が生じた理由

購入したノートPCの実際価格が予定価格を下回ったため。

次年度使用額の使用計画

関連書籍の購入に使う予定

  • 研究成果

    (5件)

すべて 2015 2014

すべて 学会発表 (5件)

  • [学会発表] Nグラムコーパスを用いたIT用語の意味ベクトルの獲得2015

    • 著者名/発表者名
      渡邊和弥, 馬青
    • 学会等名
      言語処理学会 第21回年次大会
    • 発表場所
      京都大学
    • 年月日
      2015-03-19
  • [学会発表] 検索語の予測におけるDeep Learning と従来の機械学習との比較2015

    • 著者名/発表者名
      谷河息吹, 馬青, 村田真樹
    • 学会等名
      言語処理学会 第21回年次大会
    • 発表場所
      京都大学
    • 年月日
      2015-03-18
  • [学会発表] Retrieval Term Prediction Using Deep Belief Networks2014

    • 著者名/発表者名
      Q. Ma, I. Tanigawa, and M. Murata
    • 学会等名
      The 28th Pacific Asia Conference on Language, Information and Computing (Paclic 28)
    • 発表場所
      Phuket, Thailand
    • 年月日
      2014-12-13
  • [学会発表] Spoken Document Retrieval Experiments for SpokenQuery&Doc at Ryukoku University (RYSDT)2014

    • 著者名/発表者名
      H. Nanjo, T. Yoshimi, S. Maeda and T. Nishio
    • 学会等名
      NTCIR-11 Workshop Meeting
    • 発表場所
      Tokyo, Japan
    • 年月日
      2014-12-12
  • [学会発表] 講演音声ドキュメント検索における反復的擬似適合性フィードバックの検討2014

    • 著者名/発表者名
      南條浩輝,吉見毅彦
    • 学会等名
      日本音響学会2014年秋季研究発表会
    • 発表場所
      北海学園大学
    • 年月日
      2014-09-04

URL: 

公開日: 2016-05-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi