• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実施状況報告書

タスク指向型情報検索システムの高速化

研究課題

研究課題/領域番号 17K12684
研究機関東京工業大学

研究代表者

欅 惇志  東京工業大学, 情報理工学院, 助教 (00733958)

研究期間 (年度) 2017-04-01 – 2020-03-31
キーワードGPGPU / データプリミティブ / 辞書 / MapReduce / パイプライン処理 / 情報検索
研究実績の概要

タスク指向型情報検索システムにおける検索プロセスは,まず検索対象文書集合に対する語の重み付けを行い,その後検索クエリが入力されれば,検索対象文書に対してスコアを計算し,検索結果の提示を行う.平成 29 年度は,主に語の重み付けの高速化に取り組んだ.
近年,大規模データを扱う上で,これまで画像処理に用いられてきた GPU を,科学技術計算などの汎用計算に用いる取り組み GPGPU が盛んである.これら成熟しつつある GPGPU を情報検索においても実現するため,1. 辞書やデータプリミティブを用いることで高速な語の重み付け計算や,2. 大規模データをチャンクに分割することで,メインメモリと比較して少メモリサイズの GPU においても大規模データに対して語の重み計算の実現を行った.
1. 語の重み計算においては,文書中の語のカウントには語のソートが必須となるが,文字列の管理が煩雑となる GPU においては,その処理効率が低下する.そこで本プロジェクトでは,語を数値化することで,高速な比較を実現した.また,GPU の特長である高い並列性を最大限活用するため,効率的な処理を提供するデータプリミティブを駆使し,語の重み計算を行う手法の提案を行った.
2. 既存の手法においては,GPU のメモリ量を超えるデータ量の文書を扱うことを想定していないため,Web スケールのデータを処理することは不可能である.そこで本プロジェクトでは,データを一定値のチャンクごとに分割することで,大規模データに対しても語の重み計算を実現する手法を提案した.その際,複数の処理をパイプラインで繋ぐことで,より高速な処理を実現した.また,アドホックなタスクにおいても処理を実現すべく,動的なチャンクサイズの推定手法の提案も同様に行った.
これらにより,GPU を用いた高速な語の重み計算手法の提案を行った.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

タスク指向型情報検索システムにおける 2 段階の検索プロセスはのうち,1 段階目のプロセスである検索対象文書集合に対する語の重み付けを高速に行う手法の提案を行った.従って,本課題は順調に進展していると考えられる.

今後の研究の推進方策

平成 30 年度は引き続き,高速な文書のスコアリング手法の提案を行う.その際,タスク指向型検索システムに特化した処理である,高速なクエリ分析の実現にも同様に取り組む予定である.

次年度使用額が生じた理由

共同研究者より高性能な計算機の無償での貸出を受けたため,物品費として計上していた予算の使用がなくなった.また,参加予定であった国際会議への参加を見送ったため,旅費として計上していた予算の使用がなくなった.これらの予算は,それぞれ,2018 年度の, TheWebConf 2018 への参加費と計算用ノード購入の費用に割り当てる.

  • 研究成果

    (15件)

すべて 2018 2017

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (14件) (うち国際学会 3件、 招待講演 1件)

  • [雑誌論文] Effective Mobile Search using Element-based Retrieval2017

    • 著者名/発表者名
      Atsushi Keyaki, Jun Miyazaki, Kenji Hatano
    • 雑誌名

      情報処理学会論文誌:データベース

      巻: Vol.10, No.3 ページ: 1-10

    • 査読あり
  • [学会発表] 画像の印象に合った音楽の推薦システムの提案2018

    • 著者名/発表者名
      追木 智明,欅 惇志,宮崎 純
    • 学会等名
      第 10 回データ工学と情報マネジメントに関するフォーラム (DEIM 2018)
  • [学会発表] GPU上で辞書を利用したN-gramクエリ尤度の効率的な事前計算2018

    • 著者名/発表者名
      若月 駿尭,欅 惇志,宮崎 純
    • 学会等名
      第 10 回データ工学と情報マネジメントに関するフォーラム (DEIM 2018)
  • [学会発表] 分散環境における多次元データに対する集約演算結果の推定とその評価2018

    • 著者名/発表者名
      張 涵,渡 佑也,欅 惇志,宮崎 純,中村 匡秀
    • 学会等名
      第 10 回データ工学と情報マネジメントに関するフォーラム (DEIM 2018)
  • [学会発表] GPU上のMapReduceによる大規模データ処理の最適な分割粒度の動的推定2018

    • 著者名/発表者名
      柳本 晟熙,欅 惇志,宮崎 純
    • 学会等名
      第 10 回データ工学と情報マネジメントに関するフォーラム (DEIM 2018)
  • [学会発表] 密度ベースクラスタリングによる多峰性コピュラを用いた情報検索の高精度化2018

    • 著者名/発表者名
      左近 健太,欅 惇志,宮崎 純
    • 学会等名
      第 10 回データ工学と情報マネジメントに関するフォーラム (DEIM 2018)
  • [学会発表] 他視点のオブジェクトを検索可能な画像検索システムの構築2018

    • 著者名/発表者名
      雛形 奎祐,欅 惇志,宮崎 純
    • 学会等名
      第 10 回データ工学と情報マネジメントに関するフォーラム (DEIM 2018)
  • [学会発表] 離散値特徴量や特異な嗜好ケースを考慮したコピュラを用いた推薦システム2018

    • 著者名/発表者名
      朝日 諒,欅 惇志,宮崎 純
    • 学会等名
      第 10 回データ工学と情報マネジメントに関するフォーラム (DEIM 2018)
  • [学会発表] Part-of-speech Tagging for Web Search Queries Using a Large-scale Web Corpus2017

    • 著者名/発表者名
      Atsushi Keyaki and Jun Miyazaki
    • 学会等名
      32nd ACM Symposium on Applied Computing (SAC2017)
    • 国際学会
  • [学会発表] Skyline-based Recommendation Considering User Preferences2017

    • 著者名/発表者名
      Shuhei Kishida, Seiji Ueda, ◯Atsushi Keyaki, and Jun Miyazaki
    • 学会等名
      Asia Pacific Web and Web-Age Information Management Joint Conference on Web and Big Data (APWeb-WAIM 2017)
    • 国際学会
  • [学会発表] A Case for Term Weighting using a Dictionary on GPUs2017

    • 著者名/発表者名
      Toshiaki Wakatsuki, ◯Atsushi Keyaki, and Jun Miyazaki
    • 学会等名
      28th International Conference on Database and Expert Systems Applications (DEXA 2017)
    • 国際学会
  • [学会発表] SIGIR2017参加 (開催) 報告 ~ 会議概要とニューラルネットな情報検索 ~2017

    • 著者名/発表者名
      欅 惇志
    • 学会等名
      第11回テキストアナリティクス・シンポジウム
    • 招待講演
  • [学会発表] RDBとKVSを相互に活用した大規模多次元データに対する集約演算の効率化2017

    • 著者名/発表者名
      渡 佑也,欅 惇志,宮崎 純
    • 学会等名
      第166回 情報処理学会データベース研究会
  • [学会発表] Effective Mobile Search using Element-based Retrieval2017

    • 著者名/発表者名
      Atsushi Keyaki,Jun Miyazaki,and Kenji Hatano
    • 学会等名
      第10回Webとデータベースに関するフォーラム (WebDB Forum 2017)
  • [学会発表] Preliminary Experiments on Semantic Tagged Information Retrieval2017

    • 著者名/発表者名
      Atsushi Keyaki, Kazunari Sugiyama, Min-Yen Kan, and Jun Miyazaki
    • 学会等名
      12th Young Researcher Association for NLP Studies (YANS 2017)

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi