研究課題/領域番号 |
16K00068
|
研究機関 | 宇都宮大学 |
研究代表者 |
横田 隆史 宇都宮大学, 工学(系)研究科(研究院), 教授 (90334078)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
キーワード | 相互結合網 / パケットスケジューリング / 輻輳制御 / 並列計算機システム |
研究実績の概要 |
相互結合網は並列計算機において通信の機能を司る重要な構成要素であり,その成否はシステム全体の性能を大きく左右する。多数の演算ユニットからなるシステムでは,多数のルータ素子の組み合わせにより相互結合網が構成され,通信はパケットを単位に複数のルータを経由することで行われる。通信頻度が高い状況ではパケット間の干渉により輻輳が発生し大きく通信性能を損なうため,その一歩手前の状態を維持させることが肝要である。本研究では,並列計算機の稼働中に臨機応変に制御する機動的な手法を探求する。本年度は,前年度の成果,すなわち理想状態の解明と評価実験環境の整備の進展を受け,それらをさらに発展させる形で研究を進めた。 【理想状態の解明】被制御系の理想状態を探求するために理想的なパケットの生成時刻(スケジュール)を粒子群最適化(PSO)により求める試みを完結させ論文誌に発表した。さらにここから大きく視点を変え,演算ノードの論理配置を設定することで輻輳の原因となるパケット間干渉を抑制する手法を検討した。遺伝的アルゴリズム(GA)の導入により,実用的な成果までの見通しが得られ。一方,理想状態の可否の見極めるために深層学習を導入し詳細な評価を行ったが,期待した結果を得るに至っていない。 【評価実験環境の整備】セルオートマトンの考え方を導入することで相互結合網シミュレータの動作を大幅に簡素化でき,GPGPUやマルチコアプロセッサ上で大幅な性能向上を果たせることを明らかにした。この成果を国内研究会およびCANDAR国際会議で発表しBest Paper Awardを受賞した。さらに,同方式のシミュレータを本研究に適用し,従来比数十倍の性能向上により上記GAを用いた研究において成果の見通しを得た。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
【機動的な制御方式の基礎検討】理想的パケットスケジューリングの研究は,相互結合網を理想的な状態(理想に近い状態)で運用できることを示し,並列計算機における通信の高速化に関して一定の成果を得られた。次のステップとして,パケットスケジューリングでえられる解を深層学習の導入により「勝ちパターン」「負けパターン」に類型化しようと試みたが,有意な成果を得るに至っていない。一方,パケットスケジューリングの方向性を発展させた論理配置に関する研究では,大きな成果までの見通しが得られており,論文を投稿中である。 【評価実験環境の整備】シミュレータの高速化の研究成果は,特に評価に膨大な時間を要するパケットスケジューリング(PSO)や論理配置(GA)の研究に大きく資した。従来型のシミュレータで数か月を要する評価が数日ないし1週間程度で完了可能になった。このため,従来では考えられなかった数の選択肢について高精度に評価することが可能になり,特にノードの論理配置の研究において大きく貢献した。これは言うまでもなく今後の研究にも大きく寄与する。
|
今後の研究の推進方策 |
理想的パケットスケジューリングの研究および演算ノードの論理配置の研究の成果から,改めて事前の通信状況の知識を前提とせずに稼働中の相互結合網を理想的に制御することの困難さが明確になった。本研究では転送途中でのパケットの廃棄を許容しないため,いったん生成されたパケットは目的ノードに到達するまで相互結合網内に存在し,他のパケットとの干渉の要因になる。こうしたパケットが並列計算プログラムの指示によって一斉に生成される。制御のためには相互結合網の内部状態が可観測である必要がある。可観測性は既往研究の成果を用いることで担保できるが,観測結果を得るまで,またそれに対応するまでの時間(観測遅延)が問題である。つまり,相互結合網を構成しているルータはそれぞれ高速に動作しているが,それらを適切に制御するためには,それぞれの動作速度を超えるスピードで内部状態を観測し制御方法を決定できなければならない,とのジレンマに達した。この事は本研究課題の計画当初から想定済みであり,そのために深層学習等の技術を導入することにより問題の解決を図る予定である。 演算ノードの論理配置に関する研究については,大規模システムへの適用方法等に関する問題が明らかになっており,その解決方法を考案し実験評価によりまとめていく予定である。シミュレータの高速化(評価環境)に関しては,GPGPUにおいて小規模ネットワークのシミュレーションを同時に複数行う場合に十分な速度を得られない課題が残っている。この解決も行う予定である。
|