• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Research-status Report

ポストペタスケール計算機環境に向けた高可用分散協調スケジューリングの研究

Research Project

Project/Area Number 25871199
Research Category

Grant-in-Aid for Young Scientists (B)

Research InstitutionNational Institute of Advanced Industrial Science and Technology

Principal Investigator

竹房 あつ子  独立行政法人産業技術総合研究所, 情報技術研究部門, 主任研究員 (70345411)

Project Period (FY) 2013-04-01 – 2015-03-31
Keywords並列分散処理 / 耐障害性 / ポストペタスケール / スケジューラ
Research Abstract

本研究は,ポストペタスケール計算機環境でアプリケーションの実効性能を維持しつつプログラムの継続実行を支援する高可用分散協調スケジューラを実証することを目的としている.ポストペタスケール計算機環境では,階層型タスク並列が計算効率を高めるための有望なプログラミングモデルの1つと考えられているが,アプリケーションプログラムには障害が発生しても継続実行できる耐障害性が求められる.よって,階層型タスク並列アプリケーションプログラムの耐障害性を支援する高可用分散協調スケジューラのプロトタイプシステムを開発し,ポストペタスケール計算機環境における性能特性を調査する.
H25年度は,高可用分散協調スケジューラのプロトタイプシステムを開発した.高可用分散協調スケジューラでは,計算に必要となるデータを障害から保全するデータストア機構と,計算ノードの健全性を監視しつつ適切に計算を実行する資源管理機構が必要となる.これらを,ポストペタスケール計算機環境においてスケーラブルでかつ,それら自体が耐障害性を持つように設計・実装する必要がある.
よって,資源管理機構とデータストア機構からなる高可用分散協調スケジューラのプロトタイプを設計し,分散協調処理ライブラリApache ZooKeeperと分散キーバリューストア(KVS) Apache Cassandraを用いて開発した.資源管理機構にはタスクの管理,計算ノードの死活監視,障害発生時のタスク再実行/削除機能を実装し,データストア機構には結果整合性を保証するKVSを用いた.本スケジューラを用いた予備実験から,処理中に計算ノードが落ちてしまった場合も自動的にタスクが再実行され,アプリケーションプログラムが継続実行できることが確認できた.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

高可用分散協調スケジューラを実証するため,(1)高可用分散協調スケジューラのプロトタイプシステムの開発,(2)ポストペタスケール計算機環境を模擬した評価環境の構築、(3)様々な条件を考慮した高可用分散協調スケジューラの評価の研究開発を進めている.H25年度は,(1)プロトタイプシステムの開発と,(2)評価実験環境の構築の研究開発を予定していた.
(1)プロトタイプシステムの開発は,資源管理機構とデータストア機構からなる高可用分散協調スケジューラのプロトタイプを設計・開発した.
(2)評価実験環境の構築は,8コアCPUを搭載した実験用計算機を購入し,仮想計算機を用いた実験環境の整備を進めることができた.

Strategy for Future Research Activity

H26年度は,(1)高可用分散協調スケジューラのプロトタイプシステムを改良しつつ,構築した(2)ポストペタスケール計算機環境を模擬した評価実験環境において(3)プロトタイプシステムを用いた評価を行い,高可用分散協調スケジューラの設計指針を示す.
(1)で開発したスケジューラを実高性能計算環境に対応させるため,産総研で開発している耐障害性ミドルウェアfalanxへの移植を行う.また,(2)の評価環境や実環境に(1)のスケジューラを分散配備し,障害の発生状況や共有するデータ量,スケジューラプロセスの冗長度,適用する計算機システムのスケール等を変化させて,本スケジューラの基本性能を調査する.また,アプリケーションプログラムおよびスケジューラの振る舞いの検証,ボトルネックの検出等を行い,ポストペタスケール計算機環境に向けたスケジューラの設計指針を示す.

Expenditure Plans for the Next FY Research Funding

海外での研究成果発表を予定していたが年度内に発表することができなかった。
H26年度前半にH25年度予定していた海外での研究成果発表を行う。

  • Research Products

    (2 results)

All 2013

All Journal Article (1 results) Presentation (1 results)

  • [Journal Article] パーシステントストレージを利用した高可用分散協調スケジューラの実装2013

    • Author(s)
      竹房あつ子、中田秀基、池上努、田中良夫
    • Journal Title

      情報処理学会研究報告

      Volume: 2013-HPC-140, No. 20 Pages: 1-6

  • [Presentation] パーシステントストレージを利用した高可用分散協調スケジューラの実装2013

    • Author(s)
      竹房あつ子、中田秀基、池上努、田中良夫
    • Organizer
      情報処理学会HPC研究会
    • Place of Presentation
      北九州国際会議場(福岡県)
    • Year and Date
      20130801-20130801

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi