• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

ストリーム処理とデータ分析処理を統合した戦略的データ活用基盤の開発

研究課題

研究課題/領域番号 24700111
研究種目

若手研究(B)

配分区分基金
研究分野 メディア情報学・データベース
研究機関独立行政法人産業技術総合研究所

研究代表者

油井 誠  独立行政法人産業技術総合研究所, 情報技術研究部門, 主任研究員 (10586712)

研究期間 (年度) 2012-04-01 – 2015-03-31
研究課題ステータス 完了 (2014年度)
配分額 *注記
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2014年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2013年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2012年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
キーワード機械学習 / ビッグデータ / データベース / 関係データベース / オンライン学習 / 確率的勾配降下法 / MapReduce / 並列処理
研究成果の概要

本研究では、データベースとHadoopをハイブリッドに利用したスケーラブルな機械学習手法を開発した。バッチ学習をHadoop上で行い、逐次的な学習処理を関係データベースの一種であるPostgreSQL上で行う。
KDD Cup 2012, Track 2の商用広告データセットを用いた回帰分析タスクで提案手法の有効性の評価を行い、State-of-the-artな機械学習フレームワーク(Vowpal Wabbit、Bismarck)等の比較を行い、Vowpal Wabbitに対して5倍、Bismarckに対して5倍から7.65倍の学習速度が得られるという結果を得た。

報告書

(4件)
  • 2014 実績報告書   研究成果報告書 ( PDF )
  • 2013 実施状況報告書
  • 2012 実施状況報告書
  • 研究成果

    (11件)

すべて 2015 2014 2013 2012 その他

すべて 雑誌論文 (2件) (うち査読あり 2件、 謝辞記載あり 1件) 学会発表 (8件) (うち招待講演 2件) 備考 (1件)

  • [雑誌論文] Apache Hiveを用いたスケーラブルな機械学習機構の構築2015

    • 著者名/発表者名
      油井誠, 小島功
    • 雑誌名

      情報処理学会論文誌: データベース

      巻: 8 ページ: 73-87

    • NAID

      110009886573

    • 関連する報告書
      2014 実績報告書
    • 査読あり / 謝辞記載あり
  • [雑誌論文] A Database-Hadoop Hybrid Approach to Scalable Machine Learning2013

    • 著者名/発表者名
      Makoto Yui, Isao Kojima
    • 雑誌名

      Proc. IEEE 2nd International Congress on Big Data, July 2013.

      巻: - ページ: 1-8

    • DOI

      10.1109/bigdata.congress.2013.10

    • 関連する報告書
      2013 実施状況報告書
    • 査読あり
  • [学会発表] Hivemall: Apache Hiveを用いたスケーラブルな機械学習ライブラリ2014

    • 著者名/発表者名
      油井誠
    • 学会等名
      第26回コンピュータシステム・シンポジウム(ComSys2014)
    • 発表場所
      芝浦工業大学 豊洲キャンパス(東京都)
    • 年月日
      2014-11-19 – 2014-11-20
    • 関連する報告書
      2014 実績報告書
    • 招待講演
  • [学会発表] Hivemall: Apache Hiveを用いたスケーラブルな機械学習基盤2014

    • 著者名/発表者名
      油井誠
    • 学会等名
      第20回先端的データベースとWeb技術動向講演会 (ACM SIGMOD 日本支部第57回支部大会)
    • 発表場所
      リコーITソリューションズ株式会社 本社事業所42F大会議室(東京都)
    • 年月日
      2014-10-04
    • 関連する報告書
      2014 実績報告書
    • 招待講演
  • [学会発表] Hivemall: Scalable Machine Learning Library for Apache Hive2014

    • 著者名/発表者名
      Makoto Yui
    • 学会等名
      Hadoop Summit 2014
    • 発表場所
      San Jose Convention Center(San Jose, CA, USA)
    • 年月日
      2014-06-09 – 2014-06-11
    • 関連する報告書
      2014 実績報告書
  • [学会発表] Hivemall: Scalable Machine Learning Library for Apache Hive2014

    • 著者名/発表者名
      Makoto Yui
    • 学会等名
      Hadoop summit 2013
    • 発表場所
      San Jose, CA, USA
    • 関連する報告書
      2013 実施状況報告書
  • [学会発表] A Database-Hadoop Hybrid Approach to Scalable Machine Learning2013

    • 著者名/発表者名
      Makoto Yui, Isao Kojima
    • 学会等名
      IEEE 2nd International Congress on Big Data
    • 発表場所
      Santa Clara, CA, USA
    • 関連する報告書
      2013 実施状況報告書
  • [学会発表] Hivemall: Hive scalable machine learning library2013

    • 著者名/発表者名
      Makoto Yui, Isao Kojima
    • 学会等名
      NIPS 2013 Workshop on Machine Learning Open Source Software: Towards Open Workflows
    • 発表場所
      Lake Tahoe, Nevada, USA
    • 関連する報告書
      2013 実施状況報告書
  • [学会発表] A Hybrid Approach to Linked Data Query Processing with Time Constraints2013

    • 著者名/発表者名
      Steven Lynden , Isao Kojima , Akiyoshi Matono , Akihito Nakamura , Makoto Yui
    • 学会等名
      The 6th Workshop on Linked Data on the Web (LDOW2013)
    • 発表場所
      Rio de Janeiro, Brazil
    • 関連する報告書
      2012 実施状況報告書
  • [学会発表] MapReduceによる確率的勾配降下法を用いた広告クリック率予測の実践2012

    • 著者名/発表者名
      後藤 康路、油井 誠、横山 昌平、小島 功、石川 博
    • 学会等名
      第155回データベースシステム研究発表会
    • 発表場所
      東京都・秋葉原
    • 関連する報告書
      2012 実施状況報告書
  • [備考] Hivemall: Hive scalable machine learning library

    • URL

      https://github.com/myui/hivemall

    • 関連する報告書
      2013 実施状況報告書

URL: 

公開日: 2013-05-31   更新日: 2019-07-29  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi