研究領域 | スパースモデリングの深化と高次元データ駆動科学の創成 |
研究課題/領域番号 |
26120534
|
研究機関 | 独立行政法人理化学研究所 |
研究代表者 |
BI CHONGKE 独立行政法人理化学研究所, 計算科学研究機構, 特別研究員 (10640930)
|
研究期間 (年度) |
2014-04-01 – 2016-03-31
|
キーワード | スパースモデリング / In-situ可視化 / データ圧縮 / 並列化 / ビッグデータ |
研究実績の概要 |
本研究は,圧縮比と誤差を制御でき,高並列性をもつデータ圧縮法のフレームワークを開発し,適用評価とIn-situ可視化の実現を目指す。
平成26年は,ポスト処理として,高い圧縮率,小さな誤差,高い並列性をもつ二つデータ圧縮手法を提案した。まずは,「2-3-4 combination」という高並列性の圧縮手法を提案して,任意な時間ステップのシミュレーションデータを圧縮できるようになった。高い圧縮率を達成するために,この手法は再帰的に圧縮を行う。つまり,ユーザが要求した判定条件まで,圧縮したデータを繰り返し圧縮する。再帰処理するときに,全体の計算ノードの負荷バランスを最適化することが重要である。「2-3-4 combination」手法は,2のn乗のノード数を利用して,1回目の圧縮で毎ノードにはk或いはk+1(k = 2, 3)時間ステップのデータを圧縮する。そうすると,2回目からの圧縮は「binary swap」の手法を使えるようになって,一番良い負荷バランスがとれるようになった。そして,圧縮の誤差を小さくするために,「m-swap」という手法を提案した。この手法は,「binary swap」の2をmで置き換えて,「2-3-4 combination」手法を拡張した手法である。mの値で簡単に圧縮の誤差をコントロールできる。さらに,ユーザの要求により,圧縮率の制御も可能になっている。
この二つの提案した並列圧縮手法の有効性は,「京」コンピューターで様々なシミュレーションデータを圧縮して評価実験を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究では,ビッグデータをIn-situ可視化分析するために,良い圧縮比,小さな誤差や高並列性をもつデータ圧縮法を提案する。
そのために,この研究は2ポスト処理向けのよい圧縮手法とIn-situ化の2段階で実施する。計画としては,平成26年は段階1を完成して,平成27年がIn-situ可視化の手法を研究する予定である。平成26年には二つの高並列圧縮手法を提案した。
|
今後の研究の推進方策 |
今年は,計画通りに,去年提案した二つのポスト処理の圧縮手法をIn-situ可視化分析できるように研究を進める。
基本的なアイデアとして,並列時の各プロセスが分担するローカル空間に対して提案手法を適用,データの特徴を抽出しながらIn-situ 可視化方法を検討する。時系列データを考えると,まず,最初の数ステップのグループを使って圧縮し,その後もグループ毎に順次圧縮する。一度圧縮した結果を再帰的に圧縮できる。
最後には,「京」コンピューターで様々の分野のシミュレーションに応用して検証する。「京」コンピューターのユーザが利用できるインタラクティブな可視化環境を提供するためにプロトタイプを作成し, 評価を実施する。
|