研究課題/領域番号 |
15H01687
|
研究機関 | 大阪大学 |
研究代表者 |
萩原 兼一 大阪大学, 情報科学研究科, 特任教授(常勤) (00133140)
|
研究分担者 |
伊野 文彦 大阪大学, 情報科学研究科, 教授 (90346172)
置田 真生 大阪大学, 情報科学研究科, 助教 (50563988)
|
研究期間 (年度) |
2015-04-01 – 2020-03-31
|
キーワード | 超高速情報処理 / アルゴリズム / 生体機能シミュレータ / 自動並列化 / 自動プログラム生成 / 負荷均衡 / ベクトル処理 |
研究実績の概要 |
生体機能シミュレータFlintがベクトル型スーパーコンピュータSX-ACE向けに生成する実行コード(以下,SX-ACEコード)に関して,SX-ACE特有の観点からメモリ参照効率を向上した.Flintは不規則な参照パターンを含むプログラムに対するベクトル化効率を最大化するため,配列の間接参照を多用したSX-ACEコードを生成する.データの依存関係を明示することで間接参照のベクトル化が可能であるが,直接参照するベクトル化と比較するとメモリ参照のコストが大きい.そこで,参照パターンを解析し,不必要な間接参照を自動的に削減する手法を提案した.さらに,間接参照が減少するようにデータ配置とベクトル化されるループ内の参照順を最適化した.心筋細胞の膜電位モデルから生成したSX-ACEコードに対して,提案手法はSX-ACE上のメモリバンド幅ピーク性能比を15%から20%に向上し,実行時間を最大25%削減した. また,昨年度に提案した計算式の実行順序変更によるシミュレーション高速化手法を発展させ,最大で1.25倍高性能なコードを生成する手法を提案した.具体的には,メモリ参照パターンの解析結果に基づいてより細かい粒度で実行順序を調整することで,キャッシュ利用効率を向上した.この手法は実行アーキテクチャによらず有効であり,CPU実行およびGPU実行の両方において性能向上を達成した.Intel Xeon CPUを用いた実行ではキャッシュミス数を66~85%に削減し,最大1.17倍の速度向上を達成した.最新のGPUであるNVIDIA Tesla V100(640個のTensorコア)を用いた並列実行ではキャッシュミス数を概ね90%に削減し,最大1.25倍の速度向上を達成した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成29年度交付申請書の研究実施計画に記載した内容に関して,研究実績の概要に記載した通り実施できたため.
|
今後の研究の推進方策 |
研究計画調書の研究計画・方法に記載した通りに実施可能と考える.
|