2022 Fiscal Year Research-status Report
Job management system with dynamic traffic control functionality
Project/Area Number |
21K11912
|
Research Institution | Osaka University |
Principal Investigator |
伊達 進 大阪大学, サイバーメディアセンター, 准教授 (20346175)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | スケジューラ / DTN |
Outline of Annual Research Achievements |
本研究では、システム外部のIoTセンサ等のデータ源から生成・取得される最新データをオンデマンドに活用する高性能計算(High Performance Computing: HPC)および高性能データ分析(High Performance Data Analysis: HPDA)を実行可能な高性能計算環境の実現を目指し、プロセッサ資源とネットワーク資源を対象としたHPC・HPDA融合計算基盤向け資源制御管理フレームワークを実現する。具体的には、今日の高性能計算機システムの有するデータ移動および計算実行の非連動性を解消する、ユーザの分散並列処理要求に対応した計算資源、および、計算ジョブの実行前後に発生しうる高性能計算機システム内部と外部のストレージ間のデータ移動に伴うネットワーク資源を統合的かつ一元的に制御・管理するトラフィック動的制御機能配備型ジョブ管理システムを中核技術として開発する。本目的のために、2年目となる2022年度は、高性能計算機システムに投入されるジョブ実行開始に合わせてシステム外のデータをオンタイムに移動させるため、大阪大学サイバーメディアセンターのスーパーコンピュータシステムで取得される実際の実行ジョブに関するデータの分析を行うとともに、機械学習を応用した高精度なジョブ実行開始時間予測手法の実現により、計算ジョブの待ち時間の最小化およびジョブスループットの最大化を可能とする手法にむけ、文献および技術調査に注力した。具体的には、実際の高性能計算機システムから得られたジョブデータに対して機械学習を応用して検証を進めている。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
2022年度においても新型コロナウイルス感染症の拡大の影響もあり、依然として思うように研究者間でのコミュニケーションが難しかった側面がある。加えて、プロセッサ・ネットワーク資源統合スケジューリングモデル・手法の考案・実装に伴い、高性能計算機システムにおけるジョブ実行開始時間を機械学習によって高精度な予測が可能になることにより、大幅にシステム利用効率およびジョブ待ち時間の短縮に繋がりうる可能性があることが判明した。そのため、機械学習を応用したスケジューリング手法の実現可能性についての調査を行なっている。
|
Strategy for Future Research Activity |
機械学習を応用したスケジューリング手法の実現可能性についての調査を行いながら、当初予定通り、提案手法の設計と実装に移行する。
|
Causes of Carryover |
2022年度においても、新型コロナウイルス感染症拡大、および、半導体の納期遅延の影響をうけ、本年度計画していた、技術調査に伴う旅費、設備導入などに影響・師匠が発生した。2023年度はさらに新型コロナウイルスの影響は縮小すると考えられ、また大学院生との対面での研究活動が容易になると考えられるため、設備導入、調査研究を加速する。
|
Research Products
(2 results)