研究概要 |
本研究は、スーパーコンピュータのハードウェア資源の利用効率を上げながら、同時にコストを削減することを目的とした研究である。そのための方策の一つとして、ジョブスケジューラのパラメータを動的に最適設定にすることを目指す。すなわち、ジョブスケジューラのパラメータを状況に応じて動的に変更することによって、システムの利用効率を向上させ、さらに省コストのシステム運用ツールの構築を目標としている。このためには、まず、パラメータ変更のタイミングに関して適切なトリガーを発見することが重要である。 ジョブスケジューラのパラメータを動的に設定変更するためのトリガー発見においては,ジョブの投入状況の変動などに関する膨大なデータを収集して取り扱うことになる。そのためにまず、ジョブのユーザ情報,投入・開始・終了時刻,使用CPU数などのログデータを収集・保持するプロファイリングツールを構築した.これを用いて、ユーザ特性および、ジョブの実行時間の特性など、多様な観点からデータの解析を行った。さらに、これらの解析結果をもとに、トリガー発見のためのアルゴリズム構築のための実験を行い、これらをまとめて国内外の学会にて発表した。 また、省電力のための取り組みとしては、京都大学のスーパーコンピュータを題材として、システムの省電力運転のための電源遮断・投入制御の方式について検討した。同システムではユーザグループごとに、利用可能な資源量の上限と、随時利用を保障する資源量が定められているため、システム全体で利用されている資源量に余裕がある場合には、利用されていない遊休資源の一部のみ電源投入してhot stand-by状態とし、その他の遊休資源の電源を遮断しておくことで、消費電力の削減とQOSの維持を両立できる可能性が明らかになった。
|