2017 Fiscal Year Research-status Report
大規模データストリーム解析高速化に向けたベンチマークセットの構築
Project/Area Number |
15K21423
|
Research Institution | Meiji University |
Principal Investigator |
秋岡 明香 明治大学, 総合数理学部, 専任教授 (90333533)
|
Project Period (FY) |
2015-04-01 – 2019-03-31
|
Keywords | データ解析 / 並列分散処理 / モデリング |
Outline of Annual Research Achievements |
2017年度は、ストリームマイニングアルゴリズムの挙動モデリングのうち、影響力の大きい入力データのモデリングに注力して研究を進めた。特に、従来のタスクスケジューリング等で広く用いられているグラフ理論の手法に限らず、他分野からの知見を活かすことができないかという検討に多くの時間を費やした。具体的には、流体計算を並列分散処理する際にメッシュを生成するが、計算が進んでいくに従い、あるいは対象の物質が物理的に移動するに従い、メッシュを再生成する必要が生じる。こうしたメッシュの生成に有効なアルゴリズムや分割領域の選定、メッシュの適切さの判定などは、対象物質の形状、計算対象の領域ごとの興味の度合い、メッシュの利用目的、対象物質の形状や周辺物質の性質に依存するメッシュの計算時間などにより大きく異なる。本研究はデータ解析を目的とした場合の入力データが計算に与える影響の切り分けとモデリングを目的としている。メッシュ計算におけるメッシュの見直しと再生成におけるアルゴリズムの選定やパラメータの決定は、本研究と本質的に同じ問題を解決しようとしていると考えた結果、こうした研究の進め方になった。その結果、問題に対する明確な解を得ることはまだできていないが、途中経過をSIAM Parallel Processing(PP)でポスター発表し、議論の場を得た。SIAM PPは応用数学の研究者と並列分散処理の研究者が集まる特殊な場ではあるが、本研究内容を議論するために必要な主要分野をカバーした学会であり、有意義な議論を行うことがきた。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
データのモデリング部分は、非常に影響力が大きい内容であるにも関わらず、従来の計算機分野で用いられてきたアプローチでは解決が極めて難しく、周辺分野の知見や技術を取り入れながら問題に取り組むことが要求されている。その結果、通常よりも時間を要していることは否めない。また、データ解析のベンチマークについても、MLperfなどの出現により関連研究の調査が重要になっており、インプットに要する時間が想定よりも大きいことが原因となり、当初の計画よりも遅れていると判断せざるを得ない状況である。
|
Strategy for Future Research Activity |
MLperfの詳細について引き続き調査し、状況によってはデータモデリングのみに注力する。また、データモデリングについても早急に問題の主要部分を解決することは困難な問題だという認識ではいるが、成功につながるアプローチの目処は最低でもつけて行きたい。
|
Causes of Carryover |
研究経過報告に記述した通り、周辺分野や技術の入力を想定以上に必要としており、大型の機材を購入したり成果発表のために海外に出張する機会が予想より少なくなった結果、想定よりも少ない利用額となった。その中でも昨年度は学会発表を1件行っているが、国内開催の国際会議であったこともあり、予算は少なくて済んだ。2019年度は引き続き研究を進めることで、機材が必要になったり学会発表を行なう必要が生じることが予想され、執行時期は遅れているが想定通りの用途で研究費を執行する予定である。
|
Research Products
(2 results)