2016 Fiscal Year Annual Research Report
Development of Fault Tolerant Work Stealing Based Computing Framework
Project/Area Number |
25730041
|
Research Institution | Kyoto University |
Principal Investigator |
平石 拓 京都大学, 学術情報メディアセンター, 助教 (60528222)
|
Project Period (FY) |
2013-04-01 – 2017-03-31
|
Keywords | ハイパフォーマンス・コンピューティング / プログラミング言語 / 計算機システム / ソフトウェア開発効率化・安定化 / ネットワーク |
Outline of Annual Research Achievements |
提案している動的負荷分散フレームワークTascellの実用性向上および耐故障実現に関する研究を行った.実用性向上の研究としては,逐次依存性を持つ枝刈りを利用するグラフマイニングアルゴリズムの共有メモリ環境および分散メモリ環境での並列実装を行い,スーパーコンピュータ上での評価により,良好な並列性能を得られることを確認した.またこの開発過程で,Tascellの耐故障機能のために必要となる,全生成タスクへの一意な識別子の付与が実用上可能であることを確認した.また,実行中のタスクの一部を安全に中断できるようにするための機能として,例外処理機能をTascellに追加し,分散メモリ環境での実アプリケーションの実行においても効率的に動作することを確認した.ノード間通信のMPIベースの実装やワークスティーリング戦略の改善など,処理系の基本性能の改善に関する研究・開発も行った. この研究過程で,Tascellの実行モデルではSingle Point of Failureの問題が解決困難であると判断したため,各ワーカが与えられた計算をそれぞれ任意の順序で実行しつつ,部分結果を保存・交換しあうことで動的負荷分散やノード故障の際の計算の継続を可能にするという新しい並列計算モデルの提案も行い,その試験実装およびマイクロベンチマークによる予備評価を行った.その結果,簡単なtree-recursive型アルゴリズムに基づくアプリケーションにおいて,少ないオーバーヘッドと良好な負荷均衡,および任意の計算ノードが故障しても計算を継続できる耐故障性を実現できることを確認した.
|
Research Products
(8 results)
-
-
-
[Presentation] Extending a Work-Stealing Framework with Probabilistic Guards2016
Author(s)
Hiroshi Yoritaka, Ken Matsui, Masahiro Yasugi, Tasuku Hiraishi, Seiji Umatani
Organizer
, Ninth International Workshop on Parallel Programming Models and Systems Software for High-End Computing P2S2 2016 (held in conjunction with ICPP2016)
Place of Presentation
Temple University Center City, Philadelphia, PA, USA
Year and Date
2016-08-16
Int'l Joint Research
-
-
-
-
-