研究概要 |
本研究は,大規模並列計算機システムでの相互結合網を主たる対象とし,システムの挙動を第三者的に観測する機構を備えることで全体として最適な制御を行うことを目標としている.並列プログラム,各ノードでの計算とノード間の通信とにより成り立つことから,ノードでの挙動把握および最適化の技術,ノード間での通信の挙動把握と最適化の技術の2つの方面からの検討を行った. 前者については,プロファイリングを前提とした最適化手法を用いた詳細な定量的評価を行った.またプロファイリングを低コストで行うための機構について検討し,シミュレータおよび一部FPGAを用いた実装評価まで行った.さらに現実的な投機方法について検討した. 後者については,相互結合の状態を大域的に把握し最適に制御するためには,その前提となる輻輳のメカニズムを明確化が必要であることを明らかにした.そこで,新たにセルオートマトンの手法を導入し,輻輳メカニズムを解明した.複雑な相互結合網を簡略化することで輻輳の発生・成長・消滅に関する本質的かつ基本的な知見を得た.さらにエントロピーを指標とする概念を導入し,輻輳制御のための手法を検討し新しい制御手法を創出した. 関連して,ノード内・ノード間の動作を正確に模擬するためのシミュレータの開発を進め,単一VLIWプロセッサの基本部分を完成するとともに,並列化にあたっての基本的な検討を行った.また,本研究の応用的な側面として,広域通信を伴う通信系を持つGrid,およびPeer-to-peerシステムの検討を行った.Gridでは,耐故障性を実現するためのチェックポインティングに関して,通信状況の正確な定性的・定量的性質を明らかにした.Peer-to-peerシステムでは前年度提案のFONet方式について包括的な検討・評価を行い,最良な手法を具体的に明らかにした. これらの研究の成果は,編の学協会誌論文,編の国際会議論文,ほか編の口頭発表論文として公表した.
|