研究課題
平成27年度の計画は、最初に既存アルゴリズムのハイブリッド並列化、通信遅延隠蔽、およびソフトウェアパイプライニングによる高速化を行う予定であったが、着想していた1次元トーラスネットワーク向けのアルゴリズム(以下、1Dトーラスアルゴリズム)を詳細に検討したところ実現に目処が立ったため、その開発・実装をまず行った。その際に、既存アルゴリズムに対して行う予定であったハイブリッド並列化および通信遅延隠蔽を1Dトーラスアルゴリズム上で実装した。これらは並列アルゴリズムにおける高速化技術であり、既存アルゴリズムで試験することが計画の一部であったが、本研究では最終的には2次元、3次元トーラスネットワーク向けアルゴリズムの開発を目標としていること、及び1Dトーラスアルゴリズムも試験的な実装であるため、その実装時に十分に試験が可能であると判断した。離散モデルによる1Dトーラスアルゴリズムの実装を無事完了させ、京を用いて試験したところ良好な結果が得られた。次に東京大学情報基盤センターの京互換機 FX10 (oakleaf) を用いて2次元トーラスネットワーク向けアルゴリズムの開発に着手した。2次元化することにより、1次元では生じなかった問題がいくつか判明したが、それらを解決し無事設計・開発・実装を終えた。oakleaf 一般ユーザ利用枠では1,440ノードの利用が上限である。この規模の実行で問題なく動作したため、Oakleaf 全 4800ノードを24時間利用可能な「大規模HPCチャレンジ」第二回募集分に応募したところ無事採択された。これまでの試験実行から 4800ノードでは 36 変数 200 サンプルでの実行が限界であったため、それに挑戦した結果、無事 11 時間 38 分 21 秒で実行を終了した。現在は論文化に必要なデータを取得し、これまでの成果をまとめているところである。
1: 当初の計画以上に進展している
当初の計画では初年度に1次元トーラスネットワーク向けのアルゴリズムを開発し、必要な課題を抽出することにしていたが、予想よりも問題が少なく2次元トーラスネットワーク向けアルゴリズムへの拡張も順調に行うことができ、目標としていた33変数を超えるDAG探索の実証も初年度で達成することができた。一方で予定していた連続値モデルであるBNRCスコアを用いた実装には、前述の2次元トーラスネットワーク向けアルゴリズムの開発を優先したため、平成27年度中には着手できなかった。
平成27年度の研究により2次元トーラスネットワーク向けアルゴリズムで現在の並列規模では十分な性能が得られることがわかった。またメモリを予想より大量に使用することもわかり、そのため現時点では3次元化のメリットは少ないと考えている。一方、離散モデルではなく、連続値モデルによる実データへの応用の重要性を感じており、平成28年度は、この対応を進める。現在の大型計算機のほとんどは、いわゆるPCクラスタであり、内部ネットワークはfat tree型が主流である。一方でトーラスネットワーク構造を採用している大型計算機は京とその互換機など一部の超高性能なものに限られる。したがって、実データへの応用を考えた場合、本アルゴリズムを利用できるユーザは限られてしまう。当初の目標はすでに達成できているため平成28年度は一般的なPCクラスタにおいても高効率な高並列化が可能かどうか検討したい。これまでの研究からトーラスネットワーク向けに考案したデータ分割方法がfat tree型のPCクラスタにおいても、高速化に有効ではないかとの着想を得ている。具体的には、トーラスネットワーク向けアルゴリズム同様にデータを分割する一方で、データを隣接通信を用いてバケツリレー式に配送するのではなく、必要な計算ノードに直接 point-to-point で配送するのである。これならば既存アルゴリズムのような全対全通信を避けられるのでfat tree型のPCクラスタでもある程度までは高効率な高並列化が可能だと期待している。
すべて 2016 2015
すべて 雑誌論文 (3件) (うち国際共著 1件、 査読あり 3件、 オープンアクセス 3件) 学会発表 (2件) (うち国際学会 2件)
Cell Death and Disease
巻: 7 ページ: e2207
10.1038/cddis.2016.101
Scientific Reports
巻: 5 ページ: 13076
10.1038/srep13076
Oncotarget
巻: 7 ページ: 17652-17664
10.18632/oncotarget.7755