研究概要 |
本研究は,大規模並列計算機での相互結合網を主たる対象とし,システムの挙動を第三者的に観測する機構を備えることで,全体として最適な状態を得ることを目的としている.このために一貫して,各ノードでの挙動把握と最適化、ノード間での通信の挙動把握と最適化,の2つの観点から研究を進めている. 相互結合網の大域的な挙動を理解するための基礎概念として,前年度に統計力学(熱力学)で多く用いられるエントロピーを導入した.本年度は,このエントロピーを相互結合網の大域的な挙動を表現する測度のひとつとして定義し,そのうえで,(1)ひとたび輻輳状態が拡大すると相互結合網の様相が大きく変わること,それは物理学での相変化に相当する事象であること,を明らかにした.また,結合網の輻輳状態とエントロピーとの関係に関して得られた知見をもとに,(2)結合網のエントロピーの値の変化により輻輳の発生を検知し結合網を効果的に制御する「エントロピー・スロットリング」手法を考案し,その有効性を明らかにした.さらに,(1),(2)の導出に使用した技法を発展させ,(3)相互結合網の準大域的な挙動把握から輻輳発生のメカニズムを明らかにする試みを行った. また,前年度の継続として,準大域的制御を行うCross-Line方式に耐故障性を加えた耐故障Cross-Line方式をまとめ,有効性を検証した. ノードでの挙動把握のため,ハードウェア化を前提としたパスプロファイラを検討した.また,動的最適化の手法と効果の検証,マルチスレッド化の手法の検討と効果の検証を行った.さらに,相互結合網で導入したエントロピー概念を,ノード内での挙動表現に適用する検討を行い,基礎的な知見を得た. こうした成果は,3編の学協会誌論文,4編の国際会議論文,1編の査読付き国内シンポジウム論文,18編の口頭発表論文として公表している.
|