提案している動的負荷分散フレームワークTascellの実用性向上および耐故障実現に関する研究を行った.実用性向上の研究としては,逐次依存性を持つ枝刈りを利用するグラフマイニングアルゴリズムの共有メモリ環境および分散メモリ環境での並列実装を行い,スーパーコンピュータ上での評価により,良好な並列性能を得られることを確認した.またこの開発過程で,Tascellの耐故障機能のために必要となる,全生成タスクへの一意な識別子の付与が実用上可能であることを確認した.また,実行中のタスクの一部を安全に中断できるようにするための機能として,例外処理機能をTascellに追加し,分散メモリ環境での実アプリケーションの実行においても効率的に動作することを確認した.ノード間通信のMPIベースの実装やワークスティーリング戦略の改善など,処理系の基本性能の改善に関する研究・開発も行った. この研究過程で,Tascellの実行モデルではSingle Point of Failureの問題が解決困難であると判断したため,各ワーカが与えられた計算をそれぞれ任意の順序で実行しつつ,部分結果を保存・交換しあうことで動的負荷分散やノード故障の際の計算の継続を可能にするという新しい並列計算モデルの提案も行い,その試験実装およびマイクロベンチマークによる予備評価を行った.その結果,簡単なtree-recursive型アルゴリズムに基づくアプリケーションにおいて,少ないオーバーヘッドと良好な負荷均衡,および任意の計算ノードが故障しても計算を継続できる耐故障性を実現できることを確認した.
|