研究概要 |
平成21年度に構築した並列計算機環境を用い,平成21・22年度に実施した統計計算におけるアルゴリズムの並列化の試行に基づいて,その効率の観点から検討を加えた。 離散データの分析においては,まずロジスティック回帰分析での正確推測における2値系列生成とその十分統計量の数え上げの手法について,条件無し・条件付推測における計算上の並列化可能領域の同定とその計算タスク分配の方策に検討を加えた。さらに,共変量効果での確率変動を基礎とした,超過変動モデルにおけるアルゴリズムの並列可能性について検討を加えた。ここでは,基礎モデルの尤度における混合化効果を表現・定量する技法が求められ,モンテカルロ積分のような求積法を基礎とするパラメトリックアプローチがその一つである。一方で,基礎モデルを指標集約の手段と考え,ブートストラップ法等により,データの持つ経験分布をもとにシミュレーションを行うノンパラメトリック推測上の方法も存在する。これらの数値解析上の技法の並列化とヘテロ環境でのスケジューリングの特性を評価した。 さらに,上記のモデルのパラメータの推測問題をベイズ推測によるアプローチととらえてその並列化について検討した。ここで複数パラメータを考慮する場合,パラメータ間の相関を考慮して,その数値計算上の技法としてMCMCを使う場合の並列化の可能性について検討した。ここでは,その基礎乱数の生成方法の問題とMCMC系列のバーンインの調整がその効率を大きく左右することが確かめられた。 さらに,多コアCPUの登場により並列化計算の基本パラダイムが多様化している。特にこの環境下では,共有メモリ下での並列化が可能になるが,本研究ではこの環境下での統計計算アルゴリズムの並列化にも検討を加えた。この結果,適切なアルゴリズムと環境を導入しなければ並列化による弊害が起きること場合があることを確認した。
|