2018 Fiscal Year Research-status Report
超大規模相互結合網のための高追従性分散制御方式の研究
Project/Area Number |
16K00068
|
Research Institution | Utsunomiya University |
Principal Investigator |
横田 隆史 宇都宮大学, 工学部, 教授 (90334078)
|
Project Period (FY) |
2016-04-01 – 2020-03-31
|
Keywords | 相互結合網 / 並列計算機 / 輻輳制御 / 一斉同期通信 / 集合通信 |
Outline of Annual Research Achievements |
相互結合網は並列計算機において通信の機能を司る重要な構成要素であり,その成否はシステム全体の性能を大きく左右する。多数の演算ユニットからなるシステムでは,多数のルータ素子の組み合わせにより相互結合網が構成され,通信はパケットを単位に複数のルータを経由することで行われる。通信頻度が高い状況ではパケット間の干渉により輻輳が発生し大きく通信性能を損なうため,その一歩手前の状態を維持させることが肝要である。本研究では,並列計算機の稼働中に臨機応変に制御する機動的な手法を探求する。本年度は,前年度までの成果である理想状態の解明と評価実験環境の整備の進展を受け,さらに違った見地からの検討を加えることで,理想状態の解明をさらに発展させた。 【理想状態の解明】被制御系の理想状態を探求するためのアプローチとして,前年度までに時間的な分散,すなわち,個々のパケットの生成時刻を細かく制御する手法を検討した。今年度は視点を変え,演算ノードの論理配置を調整することで輻輳の原因となるパケット間干渉を抑制する手法を考案し,遺伝的アルゴリズム(GA)の導入により解(近似解)を求める手法を検討した。前年度までに行った検討は時間的な調整に関するものであるが,これに対し,今年度はこれと直交する概念である空間的な調整を試みた。前年度に行った予備的な評価の結果を踏まえ,今年度は性能・効率ともに優れた様々な手法を考案し,シミュレーション評価により一定の有効性を確認した。その成果は現在学協会誌論文に投稿中である。一方、これらの研究の過程で,ノード数が数万を超える超大規模システムに対しては,計算時間や達成性能の点において課題が残っていることが明らかになった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
並列計算機の相互結合網では,輻輳状態においてもパケットの廃棄を行わないことが前提になる。このため,本研究課題の目標である高追従性分散制御を実現するにあたり,輻輳状態が発生してからの(事後の)対策では有効な手法を取りにくい。本課題の研究過程で,輻輳状態に陥るまえに結合網を少しでも理想的な状態に近づけることが根本的な対策への近道になると考え,その理想状態を明らかにすることをサブゴールとするよう軌道修正を行った。本研究は,成果を論文にまとめ論文誌に投稿するレベルに達成している。
|
Strategy for Future Research Activity |
今年度までの成果として,時間的・空間的な面での理想状態を解明する方法を求め,実際に理想状態を得るところまで達成してきた。次年度は,まず,時間的・空間的の2つの観点で検討していた理想状態についての議論をまとめ,汎化させる計画である。また,本課題の中でシミュレータの高速化を達成したが,これは相互結合網の挙動を模擬するものであり,本質的に膨大な数の試行錯誤が求められる本研究では,挙動模擬以外の部分の計算量も膨大であり,なお一層総合的な高速化が求められる(大規模なものでは1ケースあたり数週間程度の時間を要している)。GPGPU等の技術を用い高速化することも検討する。
|
Causes of Carryover |
年度末に遠方(福岡市)への学会出張があり,その旅費金額が学内手続きの時点では確定しなかったため,事前の予想金額との差が残った。残額は1万円に満たない僅少なものであるため,これのみを独立して使用することはせず,次年度の予算に繰り込み有効に使用する予定である。
|
Research Products
(17 results)