2017 Fiscal Year Research-status Report
Project/Area Number |
17K12682
|
Research Institution | National Institute of Informatics |
Principal Investigator |
胡 曜 国立情報学研究所, 大学共同利用機関等の部局等, 特任研究員 (50791232)
|
Project Period (FY) |
2017-04-01 – 2019-03-31
|
Keywords | データセンター / 光無線 / ネットワークトポロジ |
Outline of Annual Research Achievements |
データセンターの各コンピュータ要素をノードとする光無線ネットワークトポロジの効果的な構成法を実現することで無駄ゼロ運用の可能性について検討した。そして、その検証、フィードバックをかけて更なる改良を進めるためのスケーラブルなネットワークシミュレータの開発を行った。 まず、ハードウェア面からのアプローチとして、CPU、メモリ、ストレージ、GPUなどといったハードウェアをラック単位で別々に集約するアーキテクチャを前提に、計算リソースに無駄がでないようなネットワーク構成の方策と問題定義を行った。次に無駄ゼロデータセンターのためのジョブスケジューリングの理論面の検討に必須となるジョブ投入モデルについて数学的な確率にしたがう手法を検討した。また、実システムからのトレース取得のために、公開されているスーパーコンピュータのジョブの運用ログの解析を行い、さらにはSimGridシミュレーションを用いて各種ベンチマークの実行結果から作成した。最終的に、そのログフォーマットを入力として実行可能なシミュレータの開発を行った。要件としては10万ノード程度までの規模で動作可能であり、かつ、本目的である無駄ゼロデータセンターの成功の可否が判断できる粒度での高速挙動解析ができることである。研究代表者の胡はPythonで実装したスパコンスケジュールシミュレータをすでに保有しているが、NetworkX/Pandasを用いて開発したトポロジ構成ツールを拡張し、統合することで、10 万ノード程度までのネットワーク生成・グラフ解析・スケジューリングシミュレーションが可能となった。現在パラメータサーベイとテストを実施中である。 今後、光無線リンクを導入し、ノード間のルーティング設定により遅延時間や実行時間を最適化する予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
最初予定通りに研究を遂行している。 評価に用いるトレースのパラメーター値の設定についてはSimGridシミュレーションを用いて各種ベンチマークの実行結果を入手し、その結果を保有、拡張したネットワークシミュレターに導入し、タスクのマッピング・スケジューリング効果をグラフ解析・データ数理分析とシミュレーションによって定量的に評価した。現在、アルゴリズムの改善や計算能力の増強を検討し、ターゲットとする100万ノード規模では現実的な実行時間で行なえるように研究を進めている。 なお、東洋電機株式会社が開発した空間光伝送装置をはじめ、理論から各種実機への展開・応用が極めて有益であると考えられるため,提案、評価結果内容が反映できるように詳細な検討を進めている。
|
Strategy for Future Research Activity |
平成30年度は、光無線通信システム上のタスクマッピングとタスクスケジューリングを改良し、CPU/メモリ/ストレージ/GPU間の通信帯域、遅延に与える影響を解析・実装・検証し、その研究成果の周知普及を図る。 平成29年度の成果に基づいてシステム管理者の観点からタスクマッピングとタスクスケジューリングを各コンピュータ要素間の通信特性に合わせた最適化を行うように発展させる。その手段として、保有したシミュレータ上でタスクのサイズ順や到着時間順などを考慮に入れ、アルゴリズムの改善や計算能力の増強を検討し、Backfill付きスケジューラを導入する。それから、 並列分散アプリケーションを実行し、単純な計算機システムや前年度の開発したシステムと比べて,通信時間、通信帯域の改良を各コンピュータ要素間に分類して解析する。無論、この時点では将来の光無線ターミナル付きスパコンが実用化されていないため、遅延の評価にあたっては 、慶應義塾大学松谷研のFPGAスイッチを用いた実機評価環境での実験結果に基づいて相対的な比率を調整するなどの対応を行う。また、東洋電機株式会社が開発した空間光伝送装置をはじめ、理論から各種実機への展開を期待し、研究開発を進める。本研究が進むにつれ、ツールを随時拡張しながら活用する予定である。計算能力が不足すれば、より多くの仮想計算機を利用できる高性能計算クラウドサービスにより大きな仮想計算機を構築して提案システムの効率を評価する。 前述したスパコンスケジューラのプログラムをオープンソースソフトウェアとして公開する。研究過程で得られた知見については、研究会・国際会議・論文誌などで随時発表し、産業界・学術界の技術者・研究者らと幅広い議論を交えながら研究を進める。
|
Causes of Carryover |
10万ノードを超える大規模システムを対象としたトポロジ生成、グラフ解析およびネットワークシミュレーションを計画しているので、これを現実的な時間内で実行するために、高いCPU 演算能力と大容量メモリを持つメニーコア計算機と高性能計算クラウドサービスの併用が必要不可欠である。また、アルゴリズムの改善や計算能力の増強、ならびにMATLAB、Mathematicaといった有償ソフトウェアの利用も検討する必要がある。 計算機アーキテクチャや並列分散システムをはじめとする幅広い分野の学会で研究成果を発表するための成果発表旅費(論文別冊を含む)が必要である。また、大量のシミュレーションデータの集計作業を含む技術補佐のために短期間の謝金も計上する。
|