2004 Fiscal Year Annual Research Report
並列化コンパイラ協調型チップ・マルチプロセッサにおけるキャッシュメモリ最適化
Project/Area Number |
03J01202
|
Research Institution | Waseda University |
Principal Investigator |
中野 啓史 早稲田大学, 理工学研究科, 特別研究員(DC1)
|
Keywords | チップマルチプロセッサ / コンパイラ / データローカライゼーション / 粗粒度タスク並列処理 |
Research Abstract |
従来より広く使われているスーパースカラ型プロセッサは命令レベル並列性を利用しているため,性能向上の限界が指摘されている.そのため近年複数のプロセッサエレメント(PE)を1チップ上に集積したチップマルチプロセッサ(CMP)に注目が集まり,実際に市場に投入されている.CMPは命令レベル並列性に加え,複数粒度の並列性を利用可能なアーキテクチャである,本研究室でもコンパイラと協調しプログラムのもつ並列性を最大限引き出すアーキテクチャとしてOSCAR CMPを提案している.OSCAR CMPの各PEはシンプルなプロセッサコア,プロセッサプライベートなデータを格納するローカルデータメモリ(LDM),ローカルプロセッサおよびリモートプロセッサからアクセス可能な2ポート構成の分散共有メモリ(DSM),そしてプロセッサと非同期にデータ転送が可能なデータ転送ユニット(DTU)を持つ.また,チップ外に共有データを格納する集中共有メモリ(CSM)を持つ. OSCAR CMPにおいて性能向上を図るにはCSMとローカルメモリ間のデータ転送を削減し,ローカルメモリを有効利用することが重要となる.そこで,前年度はプログラム中のループをLDMサイズに入る大きさに分割し,LDMを介してデータの授受が可能となるようにスケジューリングすることでデータローカリティの有効利用を図るデータローカライゼーション手法の開発を行った.さらなる性能向上を図るために,データローカライゼーション手法を適用後に残存するデータ転送をCPUと非同期に動作可能なDTUを用いて行うプレロードポストストア手法について研究を行った.また,これらの技術を近年需要が高まっているメディアアプリケーションに適用すべく,これらのアプリケーションの調査を行った.
|
Research Products
(1 results)