本研究は、次元削減技術(主成分分析(PCA))を用いることで、第一原理的5次元核融合プラズマ乱流シミュレーションデータ中から特異的な位相(位置・速度)空間内構造を抽出することを目的とする。抽出した位相空間構造の時系列データの解析により、突発的な熱輸送現象と関連する位相空間構造の変化を発見する。 本研究で対象とする5次元時系列データは数10TB規模となり、通常はMPIなどの分散処理が必要となる。本研究では、大規模データ処理フレームワークDaskベースでIncremental PCAを実装することで、MPIなどの分散処理なしに、大規模データのPCAを可能にした。開発したIncremenal PCAは、Daskベースの機械学習ライブラリDask-mlにマージされた。 開発手法により、従来は高次元ゆえ可視化困難であったデータを位相空間基底(3次元)と空間係数の時系列データ(3次元)の組みとして表現することに成功し、突発的な熱輸送現象と関連する空間、速度空間構造を明らかとした。一方、開発手法では、5次元時系列データをストレージへ蓄積した後、そのデータに対して主成分分析を適用するため、極めて大規模なストレージ(>100TB)が必要である。このような大規模ストレージはスーパーコンピュータでも通常利用出来ず、データを保存せずその場で処理するin-situ化が欠かせないことが明らかとなった。 この問題を解決するためシミュレーションコードで計算されるメモリ上のデータへ直接処理を適用することを試みた。5次元核融合プラズマ乱流シミュレーションと対応する最も簡略なモデルである2次元(位置・速度)コードを作成し、Daskスクリプトとシミュレーションコードを結合することでデータ保存なしのin-situ Incremental PCAを実現した。本成果は、複数の国内および国際学会で発表された。
|