• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2018 年度 実績報告書

有用な仮説の自動探索・検証の高速化に関する研究

研究課題

研究課題/領域番号 16K00154
研究機関大阪大学

研究代表者

鬼塚 真  大阪大学, 情報科学研究科, 教授 (60726165)

研究期間 (年度) 2016-04-01 – 2019-03-31
キーワードデータマイニング / 探索的データ分析 / 高速化
研究実績の概要

ビジネスデータの分析手法は,データの大規模化・多様化に伴い,従来の分析者が手動で分析を行う OLAPベースの手法から,システム側が自動で分析し分析者に有用な分析結果を推薦する探索的データ解析手法に移行している.しかし,探索的データ分析では, 多様なOLAP クエリあるいは多様な部分データを総当たりして有用性の高い分析結果を探索するため, 膨大な時間を要する問題がある.
本年度は,以下の2点に関して取り組みを行った.
・データキューブを用いて大域例外探索と局所例外探索の中間結果を共有化することで,効率的に双方の探索を同時実行するフレームワークを完成した.本フレームワークはSparkSQLを用いて実装されており,高いスケーラビリティおよび近似探索の高い精度を達成した.具体的には,データキューブを用いて統計情報を記録するとともに,データキューブと入力データの結合操作に対してhash joinを用いて高速に統計情報を差分更新する機構を実装した.
・経営科学系研究部会連合協議会が主催するデータ分析コンペティションで提供されたヘアサロンの売り上げデータおよびファッションECサイトの売り上げデータに対して,提案フレームワークを適用し有効性を検証した.その結果,地域性の観点および時間的観点それぞれにおいて例外的なふるまいをする分析データを自動的に探索できたことを確認した.

  • 研究成果

    (3件)

すべて 2019 2018

すべて 学会発表 (3件) (うち国際学会 1件)

  • [学会発表] 大域的・局所的データ分析を両立した効率的なフレームワーク2019

    • 著者名/発表者名
      松本拓海,佐々木勇和,鬼塚真
    • 学会等名
      データ工学と情報マネジメントに関するフォーラム
  • [学会発表] Data Slice Search for Local Outlier View Detection: A Case Study in Fashion EC2019

    • 著者名/発表者名
      Takumi Matsumoto, Yuya Sasaki, Makoto Onizuka
    • 学会等名
      Data Analytics solutions for Real-Life Applications
    • 国際学会
  • [学会発表] 探索的データ分析におけるフレームワークの効率化2018

    • 著者名/発表者名
      松本拓海,山室健,小笠原麻人,佐々木勇和,鬼塚真
    • 学会等名
      The 2nd cross-disciplinary Workshop on Computing Systems, Infrastructures, and Programming

URL: 

公開日: 2019-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi