• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

有用な仮説の自動探索・検証の高速化に関する研究

Research Project

Project/Area Number 16K00154
Research InstitutionOsaka University

Principal Investigator

鬼塚 真  大阪大学, 情報科学研究科, 教授 (60726165)

Project Period (FY) 2016-04-01 – 2019-03-31
Keywordsビッグデータ / データマイニング / 高速化
Outline of Annual Research Achievements

ビッグデータによる分析が注目されているが,ビジネス業界で最も普及しているOLAP 分析においては,データの多様化に伴い検証するべき仮説の件数が膨大になるため,有益な仮説を発見することは人手では困難かつ膨大な時間を要するという問題が生じている.本問題に対して,膨大な仮説集合を網羅的かつ自動的に探索・検証し,その処理を飛躍的に高速化するという課題に挑戦する.本課題を解決することで,人手による仮説の立案が不要になり,多様かつ大規模なデータに対して網羅的かつ高速に有益な仮説の探索・検証が可能になるため,データサイエンティストを要せずビッグデータ解析が可能となる.この結果,ビッグデータの活用が普及していない企業にビッグデータ分析を普及させることが可能となり,産業の発展に貢献することができる.
今年度の具体的な成果は次のとおりである.1)有益な仮説探索を高速化するため,ヘフディングの確率不等式を活用し,サンプリングデータを用いて全体データに対する分析結果が取り得る範囲を推定し,この推定値を用いることで標準的な傾向から乖離する部分データを高速に特定する手法を確立した.本成果は技術の高さが評価され国際ワークショップに採択された.2)有益な仮説を探索するため,LOFを用いて例外的なOLAP分析結果を探索する方法を提案し,更にOLAP分析結果をグリッド分割することで,高速に例外的なOLAP分析結果を探索する手法を確立した.3)経営科学系研究部会連合協議会が主催するデータ解析コンペティションに参画し,実際にファッションECサイトのデータに適用して有益な仮説が自動的に抽出できたことを検証した.本成果をDB部会にて発表し,分析結果の良さが認められ最優秀賞を受賞した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

有益な仮説を探索する手法として,1)標準的な傾向から乖離する部分データを高速に特定する課題に関しては,確率不等式を活用した高速化手法を確立した.2)LOFを用いて例外的なOLAP分析結果を高速に特定する課題に関しては,グリッドを活用した高速化手法を確立した.3) 経営科学系研究部会連合協議会が主催するデータ解析コンペティションに参画し,実際にファッションECサイトのデータに適用して有益な仮説が自動的に抽出できたことを検証した.以上の結果から,当初の計画に従っておおむね順調に進展していると判断する.

Strategy for Future Research Activity

(1)例外的なOLAP分析結果を生み出す部分データを高速に特定する技術と,確率不等式を活用した高速化手法を融合することで,OLAP分析結果を特定する技術の大幅な高速化を行う.
(2)有益な仮説の探索範囲を拡大するため,これまで利用者が規定していたOLAPクエリそのものバリエーションを探索する技術の研究を行う.
(3)昨年度に引き続き,経営科学系研究部会連合協議会が主催するデータ解析コンペティションあるいは電子情報通信学会が企画するI-Scover チャレンジ等に参画して,本研究成果の成功ユースケースを作り上げ社会にアピールする.

Causes of Carryover

大量データ分析用サーバを購入する予定であったが,大学の予算で購入したサーバを利用することができたため,計画との乖離が生じた.研究計画の遂行には影響はなかった.

Expenditure Plan for Carryover Budget

小規模実験用PC ×2(40万円),国内学会発表1人×2 回(10万円),国際学会発表2人×1回(60万円)

  • Research Products

    (4 results)

All 2017

All Presentation (4 results) (of which Int'l Joint Research: 1 results,  Invited: 1 results)

  • [Presentation] 行列分解に基づく行動推薦と応用2017

    • Author(s)
      鬼塚 真
    • Organizer
      電子情報通信学会 総合大会
    • Place of Presentation
      名古屋県 名古屋市
    • Year and Date
      2017-03-24
  • [Presentation] Efficient Data Slice Search for Exceptional View Detection2017

    • Author(s)
      Yohei Mizuno, Yuya Sasaki, Makoto Onizuka
    • Organizer
      International Workshop On Design, Optimization, Languages and Analytical Processing of Big Data (DOLAP)
    • Place of Presentation
      イタリア ベニス
    • Year and Date
      2017-03-21
    • Int'l Joint Research
  • [Presentation] 局所例外部分データの自動探索2017

    • Author(s)
      小笠原 麻斗, 水野 陽平, 佐々木 勇和, 鬼塚 真
    • Organizer
      データ工学と情報マネジメントに関するフォーラム (DEIM 2017)
    • Place of Presentation
      岐阜県 高山市
    • Year and Date
      2017-03-06 – 2017-03-08
  • [Presentation] ビッグデータ技術の潮流 - グラフマイニングとIoT の動向と応用 -2017

    • Author(s)
      鬼塚 真
    • Organizer
      日本マリンエンジニアリング学会 第61回特別基金講演会
    • Place of Presentation
      東京都
    • Year and Date
      2017-03-03
    • Invited

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi