研究課題/領域番号 |
21K17727
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分60050:ソフトウェア関連
|
研究機関 | 国立研究開発法人産業技術総合研究所 (2022) 国立研究開発法人理化学研究所 (2021) |
研究代表者 |
深井 貴明 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究員 (00871328)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2024年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2023年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2022年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2021年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | 仮想化技術 / 高性能計算 / コンピュータセキュリティ |
研究開始時の研究の概要 |
近年、様々な分野でデータが爆発的に増加し、これを共用 HPC 環境で計算処理する需要が増えている。しかし、現在の共用 HPC はユーザーが管理者権限を持つこと (以後 root 化) ができないため、クラウド環境と比べユーザーによるソフトウェアの導入やシステムレベルの最適化が困難である。これまで 共用 HPC 環境での完全な root 化はセキュリティと性能のトレードオフがあり実現されていない。 本研究ではこのトレードオフを解決するシステムを軽量ハイパバイザというシステムソフトウェアを基に設計し、共用 HPC 環境の性能を維持しつつ安全な root 化の実現する。
|
研究実績の概要 |
本研究課題では、共用 HPC 環境でユーザーによる管理者権限の利用を安全かつ性能劣化なしに実現することで、HPC 環境の用途を広げることを目的としている。このためには 4 つの要件 (1)ユーザーのroot 化、(2) HPC システムの保護、(3) 計算環境の高速なリストア、(4) 性能劣化の回避、という4つの要件を満たす必要がある。これらの要件満たす設計として、軽量ハイパバイザを用いたハードウェア保護と高速リストア機構を提案し研究開発をしている。ハイパバイザを用いることで、ユーザーに OS の管理者権限を付与し OS 上でいかなる変更をされてもシステム管理機能は OS に非依存で動作可能であり、これによって要件(1)を満たす。また、ハードウェアへの不正な操作を禁止する機能および数十秒程度で OS 起動直後の状態に戻せる機能を提供することで(2)(3)を満たす。さらに、軽量ハイパバイザは一般的な仮想化技術と比べ性能劣化が大幅に減らせることが特徴があるため、これによって要件(4) を満たす。 本年度の成果として、上記4つの要件を満たす満たすプロトタイプ実装の完了、およびこのプロトタイプによる基本的な評価結果がある。軽量ハイパバイザの実装はスーパーコンピュータ富岳に搭載されている CPU である A64FX を搭載するサーバーマシン FX700 でハードウェア保護と高速リストア機構が動作可能なプロトタイプ実装を完了した。また、このプロトタイプ実装は富岳と同型マシンである FX1000 でも起動および高速リストアが動作可能であることを確認した。今回実装した軽量ハイパバイザは本研究のみならず幅広い研究開発に応用可能と考え、その一部を MIT ライセンスのもと MilvusVisor という名前でソースコードを公開している。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度の進捗は (1) 本研究課題で研究開発している軽量ハイパバイザ MilvusVisor のプロトタイプ実装の完了、(2) MilvusVisor の基本的な評価実験の完了、(3) 富岳の計算ノードの同型機の FX1000 での動作確認や簡易実験 (4) FX700 での詳細性能分析への着手がある。また、(1) と (2) の成果は国内研究会論文として 2 本投稿した。以下で各進捗について示す。 (1) については昨年度時点で動作が不安定であった部分の修正しプロトタイプ実装として完了した。(2) について、基本性能評価として富岳の計算ノードの同系統機である FX700 上で OS が直接動作している場合と同マシンで軽量ハイパバイザを動作させその上で OS を動作させた場合とで性能を比較した。性能評価の結果、CPU 、メモリ、およびネットワークの性能に軽量ハイパバイザによる大きな性能劣化がないことが確認できた。(3) について MilvusVisor の起動処理などを一部拡張実装することで FX1000 でもハイパバイザの起動および高速リストア機能が動作することを確認した。一方ハードウェアの保護機構については、FX1000 搭載のデバイス仕様が非公開であるため現在は対応できていない。また、メモリベンチマーク (STREAM Triad) による測定の結果、性能低下は約 3.3% であるという結果を得た。(4) FX700 での詳細性能分析として、マイクロベンチマークおよびアプリケーションベンチマークに着手した。マイクロベンチマークとして、OS とハイパバイザのコンテキストスイッチ回数や時間の測定に着手した。また、アプリケーションベンチマークとして Key-value ストアの Redis による性能測定に着手している。
|
今後の研究の推進方策 |
次年度の計画として、詳細な性能評価の結果をまとめ、国際学会への投稿することとする。このために、次年度は前半には性能測定を一通り完了し測定結果を取得し、中期にはこれらの結果を分析を行い結果をまとめ投稿する。性能測定は、具体的には既存の仮想マシンモニタとの詳細な性能比較、およびアプリケーション性能への影響評価がある。詳細な性能比較では、OS とハイパバイザのコンテキストスイッチ回数や時間を MilvusVisor と KVM で比較する。また、アプリケーション性能への影響評価については、仮想化なし、MilvusVisor、および KVM で性能測定を行い比較する。対象とするアプリケーションは MPI を用いて分散実行される HPC アプリケーション、および Key-value ストアなどクラウド環境で利用されるアプリケーションとする。 予想される困難として、性能測定の結果が想定と大きく異なる結果を得た際に、その原因を特定することが挙げられる。このような場合には、プロファイラーの利用や複数の ARM マシンで性能測定によって原因特定のための手かがりを増やすことを考える。また、性能測定は自動化することによって再測定を容易にすることで様々な条件で性能測定を行い予期しない性能差の原因特定を迅速化する。測定の自動化には、過去に代表者が作成した性能測定スクリプトやツールを利用できると考えている。
|