• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実施状況報告書

ポストペタスケール計算機環境に向けた高可用分散協調スケジューリングの研究

研究課題

研究課題/領域番号 25871199
研究種目

若手研究(B)

研究機関独立行政法人産業技術総合研究所

研究代表者

竹房 あつ子  独立行政法人産業技術総合研究所, 情報技術研究部門, 主任研究員 (70345411)

研究期間 (年度) 2013-04-01 – 2015-03-31
キーワード並列分散処理 / 耐障害性 / ポストペタスケール / スケジューラ
研究概要

本研究は,ポストペタスケール計算機環境でアプリケーションの実効性能を維持しつつプログラムの継続実行を支援する高可用分散協調スケジューラを実証することを目的としている.ポストペタスケール計算機環境では,階層型タスク並列が計算効率を高めるための有望なプログラミングモデルの1つと考えられているが,アプリケーションプログラムには障害が発生しても継続実行できる耐障害性が求められる.よって,階層型タスク並列アプリケーションプログラムの耐障害性を支援する高可用分散協調スケジューラのプロトタイプシステムを開発し,ポストペタスケール計算機環境における性能特性を調査する.
H25年度は,高可用分散協調スケジューラのプロトタイプシステムを開発した.高可用分散協調スケジューラでは,計算に必要となるデータを障害から保全するデータストア機構と,計算ノードの健全性を監視しつつ適切に計算を実行する資源管理機構が必要となる.これらを,ポストペタスケール計算機環境においてスケーラブルでかつ,それら自体が耐障害性を持つように設計・実装する必要がある.
よって,資源管理機構とデータストア機構からなる高可用分散協調スケジューラのプロトタイプを設計し,分散協調処理ライブラリApache ZooKeeperと分散キーバリューストア(KVS) Apache Cassandraを用いて開発した.資源管理機構にはタスクの管理,計算ノードの死活監視,障害発生時のタスク再実行/削除機能を実装し,データストア機構には結果整合性を保証するKVSを用いた.本スケジューラを用いた予備実験から,処理中に計算ノードが落ちてしまった場合も自動的にタスクが再実行され,アプリケーションプログラムが継続実行できることが確認できた.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

高可用分散協調スケジューラを実証するため,(1)高可用分散協調スケジューラのプロトタイプシステムの開発,(2)ポストペタスケール計算機環境を模擬した評価環境の構築、(3)様々な条件を考慮した高可用分散協調スケジューラの評価の研究開発を進めている.H25年度は,(1)プロトタイプシステムの開発と,(2)評価実験環境の構築の研究開発を予定していた.
(1)プロトタイプシステムの開発は,資源管理機構とデータストア機構からなる高可用分散協調スケジューラのプロトタイプを設計・開発した.
(2)評価実験環境の構築は,8コアCPUを搭載した実験用計算機を購入し,仮想計算機を用いた実験環境の整備を進めることができた.

今後の研究の推進方策

H26年度は,(1)高可用分散協調スケジューラのプロトタイプシステムを改良しつつ,構築した(2)ポストペタスケール計算機環境を模擬した評価実験環境において(3)プロトタイプシステムを用いた評価を行い,高可用分散協調スケジューラの設計指針を示す.
(1)で開発したスケジューラを実高性能計算環境に対応させるため,産総研で開発している耐障害性ミドルウェアfalanxへの移植を行う.また,(2)の評価環境や実環境に(1)のスケジューラを分散配備し,障害の発生状況や共有するデータ量,スケジューラプロセスの冗長度,適用する計算機システムのスケール等を変化させて,本スケジューラの基本性能を調査する.また,アプリケーションプログラムおよびスケジューラの振る舞いの検証,ボトルネックの検出等を行い,ポストペタスケール計算機環境に向けたスケジューラの設計指針を示す.

次年度の研究費の使用計画

海外での研究成果発表を予定していたが年度内に発表することができなかった。
H26年度前半にH25年度予定していた海外での研究成果発表を行う。

  • 研究成果

    (2件)

すべて 2013

すべて 雑誌論文 (1件) 学会発表 (1件)

  • [雑誌論文] パーシステントストレージを利用した高可用分散協調スケジューラの実装2013

    • 著者名/発表者名
      竹房あつ子、中田秀基、池上努、田中良夫
    • 雑誌名

      情報処理学会研究報告

      巻: 2013-HPC-140, No. 20 ページ: 1-6

  • [学会発表] パーシステントストレージを利用した高可用分散協調スケジューラの実装2013

    • 著者名/発表者名
      竹房あつ子、中田秀基、池上努、田中良夫
    • 学会等名
      情報処理学会HPC研究会
    • 発表場所
      北九州国際会議場(福岡県)
    • 年月日
      20130801-20130801

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi