研究概要 |
ワークステーションやパーソナルコンピュータのプログラムでは,レジスタや演算器などの資源を有効に利用することによりソフトウェアを高速化できるが,最近では,大規模化したメモリのアクセスに要するコストも大きくなり,メモリアクセスを考慮したハードウェア・ソフトウェア両面からの高速化が重要な課題となっている. メモリアクセスでいわゆるアドレスポインタを介した間接メモリアドレッシングは,非常に簡単なハードウェアで実現でき,メモリアクセスに要するコストも少ない.また,アドレスポインタに対する簡単な更新操作は算術・論理演算と同時に実行できるようになっている場合が多く,これを効率よく利用すればメモリアクセスを高速実現でき,ソフトウェア全体の効率化につながる.この間接アドレッシングを汎用言語プログラムのメモリアクセス全てに用いた場合,現在のコンパイラ技術ではメモリアクセス上のオーバーヘッドを多数生じ,ソフトウェアの効率が大きく劣化してしまう.そこで本研究では,メモリアクセスを全て間接アドレッシングだけで行いプログラムを効率化する諸方法について提案を行う.本年度は従来まで行ってきた研究を元として,より拡張した間接アドレツシングの下で効率的アクセスが可能な変数アドレス配置を求める発見的アルゴリズムを提案している. まず,アドレスポインタが±2まで操作できる間接メモリアドレッシングについて変数のアドレス配置を決定するアルゴリズムの提案を行った.仮定した間接アドレッシングにおいては効率的AR操作だけでメモリアクセス可能なグラフ構造が3点クリークグラフ(三角形状)をチェインした形状(Chained 3rd Clique Graph:CCG-3)になることを示し,与えられたメモリアクセス系列をグラフ表現し(アクセスグラフ),ここからCCG-3を抽出することにより効率的なメモリアクセスが可能な変数アドレス配置を得ることができる.更に,アドレスポインタが±κまで操作できる場合についても同様に,CCG-(κ+1)をアクセスグラフから抽出する方法に基づくアドレス配置方法を提案している.次に,アドレスポインタがモジュロー更新できる場合について検討を行った.この間接アドレッシングにおいて効率的AR操作だけでメモリアクセス可能なアクセスグラフ形状を示し,四角形グラフをチェインした形状(Chained Square Graph:CSG)の抽出に基づく発見的アルゴリズムを提案している.更に,フレームワーク部分としてC言語用コンパイラからのメモリアクセス部分の抽出も進めているが,上記で提案した2つのアルゴリズムがメモリアクセス系列だけを入力としているため,適用は容易であると考えられる.
|