• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Research-status Report

分散マスタによる高信頼性・高性能MapReduceの実現

Research Project

Project/Area Number 23700036
Research InstitutionOsaka University

Principal Investigator

置田 真生  大阪大学, 情報科学研究科, 助教 (50563988)

KeywordsMapReduce / 並列分散処理 / 高性能計算 / PageRank
Research Abstract

本研究の全体構想は、近年普及が進んでいる大規模分散並列処理フレームワークMapReduceについて、ミッションクリティカルシステムでの利用に耐えうる実装を提供することである。この構想のもと、本研究では次の2つの目的を遂行する。
1:Hadoopのマスタを多重化することによる耐故障性の向上
2:Hadoopにおいて複数のマスタに処理を分散することによる実行性能の向上
平成24年度は主に2の目的であるHadoopの性能向上に取り組んだ。当初の計画を変更し、アプリケーション実行中のデータの動き(データフロー)の改善による性能向上を目指した。
まず、データフローの改善に必要な情報を収集し、可視化するツールを作成した。このツールはアプリケーションの性能ボトルネックおよびその性能を向上させるためのパラメータを自動的に検出し、それらを直観的な図形式で表示する。このツールを利用することで、Hadoopに十分習熟していないユーザであっても少ない労力でHadoopアプリケーションの性能を改善できる。
次に、Hadoopにおける代表的なアプリケーションの1つであるPageRankについて、データフローの重複を削除し高速化する手法を開発した。この手法は既存の高速化手法と比較して最大1.57倍の高速化を達成した。この手法の意義は、PageRankに限らずHadoopを用いた一般的なグラフ処理の高速化を期待できる点にある。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

当初の研究計画では、23年度はHadoopの耐故障性向上について遂行し、24年度以降はHadoopの高速化について遂行する予 定であった。
まず前者については、主に23年度に取り組み、その成果をまとめて24年度に国際ワークショップにおいて発表した。当該発表はHadoopの国内ベンダから関心を得ている。
次に後者については、2つの成果を達成している。1つは性能ボトルネックの可視化であり、24年度に国内口頭発表をしたところ、論文誌への推薦を受けて投稿を予定している。もう1つはHadoopの主要アプリケーションの1つであるPageRankの高速化であり、25年度の査読付き国内会議に採択され、優秀若手研究賞が内定している。

Strategy for Future Research Activity

25年度では、Hadoopの性能向上を目的に、引き続き以下の2つの課題に取り組む予定である。
(1)データフローの可視化:Hadoopではデータの分散および転送が暗黙的に行われるため、性能低下の原因となるデータフローの把握が難しい。そこで、実行の記録からデータフローを可視化するシステムを開発する。
(2)中間データ量の削減:Hadoopアプリケーションの性能低下を招く主な原因は、計算の途中で生成・転送する中間データである。そこで、中間データの重複に着目し、中間データのサイズを汎用的に削減できる仕組みを開発する。
まず(1)については、現在開発中のツールに加え、Hadoopの主な利用対象である大規模環境に適した可視化の研究に取り組む。
次に(2)については、24年度に開発したPageRankの高速化手法を基に、一般的なアプリケーションに適用出来るように拡張した汎用的な手法の開発を計画している。

Expenditure Plans for the Next FY Research Funding

国際会議の開催場所が国内であったため、予定よりも旅費の使用額が少なく、次年度研究費が発生した。
研究計画には変更なく、前年度の研究費も含め、当初予定通りの計画を進めていく。
主に研究成果の発表に費用を使用する予定である。

  • Research Products

    (5 results)

All 2013 Other

All Presentation (5 results)

  • [Presentation] MapReduce を用いたグラフアプリケーションにおける重複メッセージの排除による高速化2013

    • Author(s)
      黒松信行, 置田真生, 萩原兼一
    • Organizer
      第11回先進的計算基盤システムシンポジウム(SACSIS 2013)
    • Place of Presentation
      仙台,日本
    • Year and Date
      20130522-20130524
  • [Presentation] Accelerating General and Heterogeneous Biophysical Simulations Using the GPU

    • Author(s)
      Tomohiro Okuyama, Masao Okita, Takeshi Abe, Yoshiyuki Asai, Taishin Nomura, Hiroaki Kitano, Kenichi Hagihara
    • Organizer
      The 4th GPU Technology Conference (GTC 2013)
    • Place of Presentation
      San Jose, CA, USA
  • [Presentation] Evolving fault-tolerance in Hadoop with robust auto-recovering JobTracker

    • Author(s)
      Nobuyuki Kuromatsu, Masao Okita, Kenichi Hagihara
    • Organizer
      The International Workshop on Networking, Computing, Systems, and Software (NCSS 2012)
    • Place of Presentation
      Okinawa, Japan
  • [Presentation] Hadoopの性能ボトルネックを特定するための実行トレース可視化ツール

    • Author(s)
      古谷達朗, 置田真生, 萩原兼一
    • Organizer
      平成24年度情報処理学会関西支部支部大会
    • Place of Presentation
      大阪, 日本
  • [Presentation] 生体モデルにおける数式の類似性に着目したOpenMPによる並列シミュレーションの検討

    • Author(s)
      吉川禎, 奥山倫弘, 置田真生, 浅井義之, 安部武志, 野村泰伸, 八木哲也, 萩原兼一
    • Organizer
      第10回先進的計算基盤システムシンポジウム(SACSIS 2012)
    • Place of Presentation
      神戸, 日本

URL: 

Published: 2014-07-24  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi