2016 Fiscal Year Annual Research Report
Research on parallel algorithms for large scale Bayesian network structure search
Project/Area Number |
15K20965
|
Research Institution | The University of Tokyo |
Principal Investigator |
玉田 嘉紀 東京大学, 医科学研究所, 特任講師 (80435495)
|
Project Period (FY) |
2015-04-01 – 2017-03-31
|
Keywords | 最適DAG探索アルゴリズム / 並列アルゴリズム / ベイジアンネットワーク / 大規模並列計算 |
Outline of Annual Research Achievements |
平成27年度は、1次元トーラスネットワーク向けアルゴリズムの実装及びその性能の解析を行い、その結果に基づいて2次元トーラスネットワーク向けアルゴリズム(以下2Dトーラスアルゴリズム)の設計・実装を行った。そして東京大学情報基盤センターの京互換機 FX10 の全システムが使用可能な「大規模HPCチャレンジ」を利用し、4,800 ノード 76,800 コアを用いて、36 変数 200 サンプルの最適 DAG 探索問題の計算を11 時間 38 分で計算させることに成功した。 平成28年度は、この2Dトーラスアルゴリズムの各種性能データの収集・解析を行い、1,296 ノード 20,736 コアまで高い並列化効率で動作することを確認できた。この成果を 36 変数の計算結果と併せて論文としてまとめた。論文は ICA3PP 2016 に無事採択され、口頭発表及び論文発表を行った。36 変数の DAG 探索を実証したのは本論文が初である。 本研究により、2Dトーラスアルゴリズムはメモリ使用量が多いことが判明した。その欠点を解消し、またトーラスネットワーク以外へも適用可能な、各ノードが直接通信する省メモリアルゴリズムを着想しその実装を行った。初期的な実験により、トーラスネットワークでも2Dトーラスアルゴリズムより性能が高いことが確認できた。この成果は現在必要なデータを収集し論文にまとめている。 DAG 探索アルゴリズム研究の目的は高精度な遺伝子ネットワーク推定であるため、連続値モデルの実装が必要である。発表論文では並列アルゴリズムの開発に焦点を置いていたため、すべて離散モデルによる実装である。従って上述の新アルゴリズム実装を用いて、連続値版のスコアである BNRC の最適 DAG 探索アルゴリズムの実装を行い、著者らのウェブサイト上で京互換機向け及びヒトゲノム解析センター向けのバイナリを公開した。
|