2019 Fiscal Year Annual Research Report
Study on highly adaptable distributed control of interconnection networks
Project/Area Number |
16K00068
|
Research Institution | Utsunomiya University |
Principal Investigator |
横田 隆史 宇都宮大学, 工学部, 教授 (90334078)
|
Project Period (FY) |
2016-04-01 – 2020-03-31
|
Keywords | 相互結合網 / 並列計算機 / 輻輳制御 / 論理配置 |
Outline of Annual Research Achievements |
相互結合網は並列計算機において通信の機能を司る重要な構成要素であり,その成否はシステム全体の性能を大きく左右する。特に多数の演算ユニットから成る大規模並列計算機システムでは,多数のルータの組み合わせにより構成された相互結合網が用いられる。そこでの通信はパケットを単位に複数のルータを経由することで行われるが,通信負荷が高い状況ではパケット間の干渉により輻輳が発生し大きく通信性能を損なう。本研究では,並列計算機の稼働中に臨機応変に制御する機動的な手法を探求する。前年度までに評価実験環境の整備および理想状態の解明を進めてきており,本年度は,理想状態の解明を進め下記の成果をまとめるに至った。 【空間的理想状態の解明】並列計算機の相互結合網では,一般に,多数のパケットが同時に行き交う状況になる。パケットが相互に干渉すると,情報の消失を避けるために一方が他方を抑制し,これにより実効通信性能の低下が発生する。これを避けるには,パケット間の干渉を避けるのが一案である。本年度は,相互結合網においてパケットの通信経路が重複しなければ干渉を避けられることに着目し,物理的配置を工夫する手法を追求した。遺伝的アルゴリズム(GA: genetic algorithm)を用いながら,この問題に適した発見的手法(heuristics)を採り入れることで,大幅な性能向上を達成できることを示した。 【機械学習手法の導入】上記の空間的最適化の検討に加え,時間的最適化についての検討を進めた。超大規模システムでは,中央集権的な管理・制御手法はコストが高い問題がある。このためにノードやルータの機能要素ごとに分散して動作可能な手法を求める必要がある。このために,機械学習の手法であるQ学習を導入し,予備評価を行ったところ,有望性を確認できた。
|