研究課題/領域番号 |
19K20263
|
研究機関 | 国立情報学研究所 |
研究代表者 |
胡 曜 国立情報学研究所, アーキテクチャ科学研究系, 特任研究員 (50791232)
|
研究期間 (年度) |
2019-04-01 – 2021-03-31
|
キーワード | 計算機ネットワーク / 光無線通信 / ネットワークトポロジ / タスクスケジューリング |
研究実績の概要 |
全光無線リンクを用いたデータセンターシステムにおける物理トポロジの動的構成法を探求した。具体的には、各アプリケーション通信の論理トポロジに基づいて、光無線リンクを用いて計算ノード間を直結することで最適な物理トポロジを構築する方式を探求した。 ハードウェア的アプローチとして、資源利用率の観点から、実際の計算機システムにおけるラック配置やFSO光無線レーザービーム干渉といった実装上の制約を考慮に入れ、真の資源利用率向上をもたらす新たな光無線アーキテクチャを導き出した。その手段として、現在最先端の光無線データセンターシステムの概念をさらに拡張し、ラック間とラック内をまたいだ計算ノードの全光無線通信ネットワーク接続を提案した。 ソフトウェア的アプローチとして、FSO通信リンク数やネットワークのフレグメンテーションの制限を考慮し、入力した通信パターンに合わせた最適な光無線トポロジの動的構成法を開発した。その手段として、Pythonで実装したスパコンネットワーク生成シミュレータとNetworkX/Pandas/C++で実装したトポロジ解析ツール群をすでに保有しており、10万ノード程度までのネットワーク生成・グラフ解析を行った。計算ノード間を、FSO光無線リンクを利用して直接オンデマンドで直結することで、アプリケーションのホップ数や通信遅延が短縮されると検証した。そして、データセンター内の通信ケーブルやスイッチが不要となり、低通信遅延FSOターミナルの実用化に伴うシステム全体のコストが削減できると検証した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
最初予定通りに研究を遂行している。 評価に用いるトレースのパラメーター値の設定についてはSimGridシミュレーションを用いて各種ベンチマークの実行結果を入手し、その結果を保有、拡張したネットワークシミュレターに導入し、タスクのマッピング・スケジューリング効果をグラフ解析・データ数理分析とシミュレーションによって定量的に評価した。現在、ランダムトポロジによるジョブマッピングが大規模計算機システムへの影響について研究している。ネットワークをFSO光無線リンクで動的に構築することでシステムスケジューリング性能の向上が可能であることを示した。今後、低通信遅延FSOターミナルの実用化に伴う大規模な計算機システムを想定し、最新FSO関連研究で触れられていない動的トポロジ構成法に応用することができるように真に効果的なタスクマッピングやタスクスケジューリングの設計法を明らかにする予定である。
|
今後の研究の推進方策 |
光無線リンクを用いてデータセンター内のトポロジを動的に変えることで、アプリケーション毎に計算ノードを柔軟に分配するスケジューリング手法を開発する。将来の全光無線通信による大規模計算機システムの効率的な利用と設計法を確立することで、次世代アプリケーション毎に実行時間が短くなることを検証する。 具体的には、前年度の成果に基づいてシステム管理者の観点からタスクマッピングとスケジューリングアルゴリズムを開発する。開発したアルゴリズムが光無線アーキテクチャ上の資源やFSOリンクの利用衝突を避け、有効な資源分配法を実現できるか否か正確に評価する。その手段として、保有したスケジューリングシミュレータを活用し、タスクを実行するトポロジを動的に計算した性能評価を行う。提案されたシステム全体を実装してその実現性を検証するとともに、前述したスパコントポロジ生成・解析ツールとスケジューラのプログラムをオープンソースソフトウェアとして公開する。また、並列分散アプリケーションを実行し、現状のケーブル計算機システムや前年度の開発した単純な光無線システムと比べて、通信待ち時間や総実行時間が短縮されることを明らかにする。無論、この時点では将来の光無線ターミナル付きスパコンが実用化されていないため、遅延の評価にあたっては 、慶應義塾大学松谷研のFPGAスイッチを用いた実機評価環境での実験結果に基づいて相対的な比率を調整するなどの対応を行う。 また、本研究が進むにつれ、ツールを随時拡張しながら活用する予定である。計算能力が不足すれば、より多くの仮想計算機を利用できる高性能計算クラウドサービスにより大きな仮想計算機を構築して提案システムの効率を評価する。 なお、研究過程で得られた知見については、研究会・国際会議・論文誌などで随時発表し、産業界・学術界の技術者・研究者らと幅広い議論を交えながら研究を進める。
|
次年度使用額が生じた理由 |
本研究では、100万ノードくらいの大規模計算機システムを対象としたトポロジ構成・グラフ解析およびイベント・ドリブン型スケジュールシミュレーションを計画している。これを現実的な時間内で実行するために、高いCPU演算能力と大容量メモリを持つメニーコア計算機、高性能計算クラウドサービスと有償数理解析ソフトウェアの併用が必要不可欠である。購入したすべての機器類は国立情報学研究所に設置し、設備を集約することで費用対効果の最大化を図る。 また、大量のシミュレーションデータの集計作業を含む技術補佐のために短時間の謝金を計上している。研究補佐要員への謝金予算は、 国立情報学研究所の規定による研究補助の謝金算定基準をもとに算出した。計算機アーキテクチャや並列分散システムをはじめとする幅広い分野の論文誌・国際会議・学会で研究成果を発表するための学術論文掲載料(論文別冊を含む)、会議・学会登録料、旅費なども必要である。旅費は、最低の交通費(エコノミー)、国立情報学研究所規定の宿泊費・日当をもとに算出した。航空運賃に関しては、調達方法によって廉価なチケットを入手することが可能なので、価格が高くない時期に早めに日程を確定し購入することで、予算の節約に細心の注意を払う。なお、収集した資料のうち公開可能なものや研究成果については公開するための印刷費が必要である。報告書も同様である。
|