研究課題/領域番号 |
16K00154
|
研究機関 | 大阪大学 |
研究代表者 |
鬼塚 真 大阪大学, 情報科学研究科, 教授 (60726165)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | ビッグデータ / データマイニング / 高速化 |
研究実績の概要 |
ビッグデータによる分析が注目されているが,ビジネス業界で最も普及しているOLAP 分析においては,データの多様化に伴い検証するべき仮説の件数が膨大になるため,有益な仮説を発見することは人手では困難かつ膨大な時間を要するという問題が生じている.本問題に対して,膨大な仮説集合を網羅的かつ自動的に探索・検証し,その処理を飛躍的に高速化するという課題に挑戦する.本課題を解決することで,人手による仮説の立案が不要になり,多様かつ大規模なデータに対して網羅的かつ高速に有益な仮説の探索・検証が可能になるため,データサイエンティストを要せずビッグデータ解析が可能となる.この結果,ビッグデータの活用が普及していない企業にビッグデータ分析を普及させることが可能となり,産業の発展に貢献することができる. 今年度の具体的な成果は次のとおりである.1)有益な仮説探索を高速化するため,ヘフディングの確率不等式を活用し,サンプリングデータを用いて全体データに対する分析結果が取り得る範囲を推定し,この推定値を用いることで標準的な傾向から乖離する部分データを高速に特定する手法を確立した.本成果は技術の高さが評価され国際ワークショップに採択された.2)有益な仮説を探索するため,LOFを用いて例外的なOLAP分析結果を探索する方法を提案し,更にOLAP分析結果をグリッド分割することで,高速に例外的なOLAP分析結果を探索する手法を確立した.3)経営科学系研究部会連合協議会が主催するデータ解析コンペティションに参画し,実際にファッションECサイトのデータに適用して有益な仮説が自動的に抽出できたことを検証した.本成果をDB部会にて発表し,分析結果の良さが認められ最優秀賞を受賞した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
有益な仮説を探索する手法として,1)標準的な傾向から乖離する部分データを高速に特定する課題に関しては,確率不等式を活用した高速化手法を確立した.2)LOFを用いて例外的なOLAP分析結果を高速に特定する課題に関しては,グリッドを活用した高速化手法を確立した.3) 経営科学系研究部会連合協議会が主催するデータ解析コンペティションに参画し,実際にファッションECサイトのデータに適用して有益な仮説が自動的に抽出できたことを検証した.以上の結果から,当初の計画に従っておおむね順調に進展していると判断する.
|
今後の研究の推進方策 |
(1)例外的なOLAP分析結果を生み出す部分データを高速に特定する技術と,確率不等式を活用した高速化手法を融合することで,OLAP分析結果を特定する技術の大幅な高速化を行う. (2)有益な仮説の探索範囲を拡大するため,これまで利用者が規定していたOLAPクエリそのものバリエーションを探索する技術の研究を行う. (3)昨年度に引き続き,経営科学系研究部会連合協議会が主催するデータ解析コンペティションあるいは電子情報通信学会が企画するI-Scover チャレンジ等に参画して,本研究成果の成功ユースケースを作り上げ社会にアピールする.
|
次年度使用額が生じた理由 |
大量データ分析用サーバを購入する予定であったが,大学の予算で購入したサーバを利用することができたため,計画との乖離が生じた.研究計画の遂行には影響はなかった.
|
次年度使用額の使用計画 |
小規模実験用PC ×2(40万円),国内学会発表1人×2 回(10万円),国際学会発表2人×1回(60万円)
|