研究概要 |
1 SRC社の商用リコンフィギャラブルマシンを用いて海洋モデルシミュレーションプログラムを実行させ性能を分析し,DMA転送が性能に大きな及ぼし,プログラミング上のチューニングを行わない場合には,かえって性能が低下する可能性があることを示した.また,通信と演算をオーバーラップさせたり,データを複数のメモリバンクにインタリーブするような,既存の最適化手法はFPGAの資源制約上の問題を生じやすいことも明らかにした.あらかじめメインプロセッサ側でデータ配列を並び替える方法を提案し,150KB程度の転送粒度を保つことで,この手法が有効になることを実証した. 2 リコンフィギャラブルマシン上にパイプライン型演算器を並べて高い性能を達成するためには,FPGAの資源制約満たしたうえで効率よく各演算のタイミングを決定する必要がある.そこで,類似した複数の演算式から共通に利用可能な演算器群を同定するアルゴリズムを提案し,ツールとして実装したうえで,FPGAを用いた生化学シミュレータの反応速度計算モジュールに適用した.その結果,共有による性能の低下を低く抑えつつ,約3割のハードウェア資源を削減できることを示した.また,高位合成技術を応用し,パイプラインへの入カデータバンド幅の制約を考慮した演算スケジューリングについて検討した. 3 新しいリコンフィギャラブルデバイスとして注目されている動的再構成可能プロセッサでは,プログラムの流れを制御するためのステートマシンが専用の機構で実現される.このため,FPGAとは異なり,ステートマシンの状態数が多くなると処理をのせることができなくなるという問題点がある.そこで,プログラム中において同一の関数を複数呼び出す構造に着目し状態を集約化する最適化手法を提案し,最大3倍程度の性能改善が可能であることを示した.
|