研究課題/領域番号 |
23300108
|
研究機関 | 統計数理研究所 |
研究代表者 |
樋口 知之 統計数理研究所, 所長 (70202273)
|
研究分担者 |
中野 慎也 統計数理研究所, モデリング研究系, 助教 (40378576)
長尾 大道 統計数理研究所, データ同化研究開発センター, 特任准教授 (80435833)
齋藤 正也 統計数理研究所, データ同化研究開発センター, 特任研究員 (00470047)
|
キーワード | 統計計算 / コンピュータ支援統計 / ベイズモデル / 並列計算 |
研究概要 |
アルゴリズムの開発においては、計算機環境の変化にも常に注視しておくことが大切である。近年、プロセッサのマルチコア化が劇的に進んでおり、GPGPU(General Purpose computation on Graphical Processing Units)、マルチコア等の100を超えるスケールの並列プログラミング環境もデスクトップパソコンで実現されつつある。逐次モンテカルロ法やブートストラップ、ブースティング、クラスタリング等のアルゴリズムを高並列計算向きに進化させることで、次元の呪いにより従来は困難とされている問題を超並列計算機システムでシンプルに解決することを目指す。その結果、GPGPUから次世代スーパーコンピュータまで、多段階層的分散超並列計算機上で効率よく統計的推測を行うための方法を確立することを本研究の目的とする。 これまでの準備研究において、素朴な粒子フィルタアルゴリズムのGPGPUへの実装研究を行った。その研究開発においては、a)プロセスエレメント(PE)に直結したオンチップ・メモリーの小容量 b)大容量である共有メモリーとPE間の通信の著しい低速度の二つが問題として浮き彫りになった。平成23年度は粒子フィルタのアルゴリズムを題材に、このGPGPUの持つ2大弱点の克服に注力した。前者の困難は、粒子フィルタのアルゴリズムというよりも、求解に逐次ベイズフィルタを必要とする一般状態空間モデル中のシステムモデルの特性(計算サイズ)に由来する問題なので、計算コストやシステムの非線形性と言った、システムモデルの特性に即したアルゴリズムの採用策を探究すればよいことは明らかである。一方、後者は、逐次ベイズフィルタ等のSIR(Sequential Importance Resampling)法の基本的原理である、リサンプリング(ベイズの定理に基づく更新式の数値的実現)プロセスに関係する問題であるので、根源的解決策が必要である。まず粒子フィルタの分散並列アルゴリズムである、Distributed Particle Filter (DPF)(Ex.Sheng et al.,2005)の近年の研究動向について調査した。その結果我々は、SIS(Sequential Importance Sampling)のような、各時刻で各粒子の計算結果の情報を非同期で扱うアルゴリズムを採用することにした。計算精度を担保した上での計算資源活用効率性を理論的に考察した結果、SISの計算資源の効率的利用の観点からは無駄である悪い点を勘案しながら、GPGPUの特性に即したアルゴリズムの改良を行った。あわせて、融合粒子フィルタのGPGPUへの適用可能性も探った。 粒子フィルタのデータへの適用問題としては、データ同化のパラメータ推定を取り扱う。具体的に言えば、これまでの研究で十分な経験のある、概日周期(動物の行動サイクルがほぼ24時間であることを説明する)パスウェイモデルと、遺伝子/タンパク発現データを統合したデータ同化を題材とする。すでに我々は、単体CPUで長時間計算することで、この問題を解決する方策の有効性を示しているが、GPGPU上で走る新しいアルゴリズムを利用することにより粒子数の飛躍的増大を実現した。概日周期モデルのデータ同化以外に、アルゴリズム改良実験の題材として適切な問題の発掘調査を行うとともに、将来的に次世代スパコンへの実装を考慮した技術的問題の調査研究を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
GPGPUを活用するためにはCUDA等のプログラミング言語を利用する必要があるが、言語知識以外のCPU利用に関する経験が実装上は相当ものをいうことがわかるまでやや時間がかかった。
|
今後の研究の推進方策 |
逐次モンテカルロ法のGPGPU向きアルゴリズムの研究開発経験をもとに、ブートストラップ法のGPGPU向きアルゴリズムを研究開発する。
|