2018 Fiscal Year Annual Research Report
大規模グラフで表現された不規則・複雑な対象を高速にシミュレーションする方法の研究
Project/Area Number |
15H01687
|
Research Institution | Osaka University |
Principal Investigator |
萩原 兼一 大阪大学, 情報科学研究科, 特任教授(常勤) (00133140)
|
Co-Investigator(Kenkyū-buntansha) |
伊野 文彦 大阪大学, 情報科学研究科, 教授 (90346172)
置田 真生 大阪大学, 情報科学研究科, 助教 (50563988)
|
Project Period (FY) |
2015-04-01 – 2020-03-31
|
Keywords | 超高速情報処理 / アルゴリズム / 生体機能シミュレータ / 自動並列化 / 自動プログラム生成 / ハイパーグラフ / ベクトル処理 / メモリアクセス |
Outline of Annual Research Achievements |
不規則なアクセスパターンを持つ並列プログラムを入力として,メモリアクセス性能の高いアクセスパターンへ変換する手法を研究した. まず,ベクトル型スーパーコンピュータSX-ACEを用いる場合の高速化を達成した.SX-ACEでは,ベクトル化の対象となる配列の定義および参照において,配列要素へ線形アクセスを行う場合にアクセス性能が高い.そこでベクトル化されるループの順番を入れ替えることでアクセスパターンを線形に変換する最適化手法を用いる.ただし,複数のベクトルデータ間で参照する配列要素に重複がある場合,線形アクセスの最大化には組み合わせ最適化を解く必要がある.そこで,メモリアクセス性能の高いアクセスパターンを貪欲法に基づいて求める手法を提案した.ベクトルデータごとの空間局所性を定量的に予測し,局所性の向上を期待できる順にループの順番と配列要素の配置を決定する.大規模な心筋細胞の膜電位シミュレーションプログラムに適用した結果,単純な手法と比較して,線形アクセスの割合を30%から60%に増大し,最大1.15倍の速度向上を達成した. 次に,GPUを用いる場合の高速化手法を研究した.具体的には,グローバルメモリ上の領域をL1キャッシュラインと同程度の大きさのチャンクに分割し,プログラムの静的なアクセスパターンを入力として,各スレッドブロックおよびワープがアクセスするチャンク数を最小化するデータ配置を求める.この問題をハイパーグラフの分割問題に変換し,それを効率的に解く分割アルゴリズムを提案した.評価実験の結果,線形アクセスの増大に特化したデータ配置と比較して,L1キャッシュミス数を70%に削減し,最大1.28倍の速度向上を達成した.分割に要する時間は,頂点数が2000万を越える大規模なハイパーグラフに対して38分であり,シミュレーション全体の実行時間と比べて無視できるものと考えている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成29年度交付申請書の研究実施計画に記載した内容に関して,研究実績の概要に記載した通り実施できたため.
|
Strategy for Future Research Activity |
研究計画調書の研究計画・方法に記載した通りに実施可能と考える.
|