研究概要 |
情報爆発時代に対応できる計算基盤として,100万のオーダのノードからなる超分散環境上で多種なアプリケーションの安全安心な実行を目的として,真の高度にスケーラブルな自律的実行基盤「リジリエント・グリッド(ResilientGrid)」を構築することをめざしている.そのために多数の計算資源の設定を人手に頼らず、高性能な仮想計算環境が自律的に、必要に応じて構成され、その上で種々のアプリケーションが安全安心かつ高性能に実行できるシステムおよびその技術の研究を推進している.主たるアプローチとして,特にXen, VMWareなどの現代の仮想(バーチャル)マシンのテクノロジの利用,障害発見・回復の自動化手法による実行基盤の自律化,光パスネットワークによる加速,ネットワークの特性やトポロジを考慮する集団通信手法による効率化,を採る.高性能仮想実行基盤の研究としては,ユーザからのパッケージ要求に応じた仮想クラスタの高速な動的構築技術の研究を行った.多様な要求に高速に答えるため,性能モデルに基づくキャッシュイメージの作成技術を開発した.さらに分散仮想クラスタにおける並列アプリケーションの評価と効率化の研究を行った.自律構成する実行基盤の研究としては,運用中の大規模分散環境に対応可能な自律的障害発見技術の開発を行った.統計的手法にもとづく技術であり,実用的並列ミドルウェアの障害特定に成功した.また実行環境の特性に適合した耐故障MPI実行環境フレームワークの研究を推進している.また光ネットワークの特性を考慮した集団通信アルゴリズムの提案と評価を行った.パスの確立・解放コストが問題となるため,それを抑える通信順序に基づくアルゴリズムの提案と評価を行った.また複数配信木とパイプライン転送技術に基づき,グリッドネットワークの特性に対応可能な集団通信アルゴリズムの研究を行った.
|