研究課題/領域番号 |
12555021
|
研究機関 | 東京工業大学 |
研究代表者 |
青木 尊之 東京工業大学, 学術国際情報センター, 教授 (00184036)
|
研究分担者 |
吉田 正典 工業技術院, 物質工学工業技術研究所, 室長
奥村 晴彦 松阪大学, 政治経済学部, 教授 (10247760)
矢部 孝 東京工業大学, 大学院・理工学研究科, 教授 (60016665)
塙 雅典 山梨大学, 工学部, 助手 (90273036)
野澤 恵 茨城大学, 理学部, 助手 (10261736)
|
キーワード | プレイステーション2 / Linux / 並列計算 / 流体解析 / Power PC / G4 Cube / Emotion Engine / Velocity Engine |
研究概要 |
平成11年6月にソニー・コンピュータエンターテイメント社からプレイステーション2Linux kitが発売された。一応、GNUのコンパイラも付属し、数値計算を行える環境が整った。本研究グループでは、プレイステーション2とLinux kitを20台購入し、数値計算と並列化の研究を開始した。プレイステーション2のCPUであるEmotion Engine(EE)は、単精度計算ながら6.2GFlopsのピーク性能を持つとされるが、実際に付属のコンパイラでコンパイルして数値計算を実行させると数10MFlopsであり、1/100程度の性能しか出ないことが判明した。数値計算としては、流体計算で最も負荷の大きいポアソン方程式の解法を選んだ。2次中心差分法による離散化式をSOR法で解いたものと、局所補間微分オペレータ法による4次精度の離散化を行った解法で検証を行った。計算速度が出ない理由は、付属のコンパイラではEE用の最適化コードを出力しないためである。そこで、アセンブラ言語により、EEを直に用いるコードの開発を行った。EEのベクトル・レジスタVU0を利用し、単精度計算に限定すれば300MFlops程度まで性能を引き出すことができることが判明した。しかし、理論性能との差は大きく、プレイステーション2が高速のRAMBUSメモリーを用いているからといってもメモリーとレジスター間のデータのロード・ストアーが大きな問題であることが分った。4つのベクトル・レジスタを使う際のスケジューリングを最適化することにより、ある程度の高速化ができる見込みが得られた。単精度計算に限定されるために、4次精度の場合には離散化式を解く際の計算精度に問題が生じること明らかになり、誤差を増大させない計算アルゴリズムの検討も開始した。問題点としては、プレイステーション2単体は32MBの主記憶しかなく、そこにOSを入れると残りが20MB以下になってしまう。従って、大規模計算は行えなくなるため必然的にネットワーク接続による並列計算が必要になる。Linux kitのネットワークは、PCカード(PCMCIA)であり、高速なネットワーク通信が余り期待できないが、並列計算を平成14年度の研究課題の中心とする。
|