• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

大規模科学技術データのための分析データベースシステムの研究開発

研究課題

研究課題/領域番号 22800086
研究機関独立行政法人産業技術総合研究所

研究代表者

油井 誠  独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (10586712)

キーワードデータベース管理システム / eサイエンス / 並列データベースシステム / 分散処理システム / 情報システム
研究概要

天文学、生命科学、地質といった科学技術分野で、国際的な情報共有が進んでいる。今後、学際的に巨大データを扱うデータ指向の科学においで、蓄積された膨大な科学技術データの中から有益な知見を見出すための高度なデータ分析技術の重要性が増すのは必至である。しかし、従来のデータベースシステムは細かい粒度のトランザクション処理を想定して設計されているため、バッチ的に複雑なデータ分析処理を扱うのは不向きである。現状のオープンソースの関係データベースは扱えないような100GB以上~ペタバイトの範囲のデータを扱うことは困難である。科学者が大規模データから有益な知識を得るためには、テラ~ペタバイト級の科学技術データを扱うことが可能な分析データベースシステムの整備が急務である。
こうした背景を受けて、本研究では、22-23年の二年計画でテラ~ペタバイト級の科学技術データを扱うためのデータ分析基盤を開発している。特に,科学技術データを適用対象とし,ゲノム情報処理等の分野融合プロジェクトへ最終的に適用することを目指している。
平成22年度は、申請者が研究開発中の汎用の分析データベースを科学技術データベース用途に移植を行った。これによって、最終的な達成にむけて、基礎とするシステムの実装と評価を完了した。
現時点の成果としては、33台の計算機クラスタ環境において、競合システムHadoop/Hiveに対して顕著な性能面での優越(最大22.3倍、平均8.97倍)があることを確認している。また、本研究で開発したデータ分割配置手法の特許申請を行った。
分野融合プロジェクトへの適用については、産業技術総合研究所の地球観測グリッド研究グループが参加する月周回衛星「かぐや」(http://www.kaguya.jaxa.jp/)のスペクトルデータの解析に本研究の成果を適用することを目標に、予備的な評価をおこなった。

  • 研究成果

    (3件)

すべて 2010

すべて 学会発表 (2件) 産業財産権 (1件)

  • [学会発表] 列指向データベースのためのタプル再分散不要の並列データベース構成法2010

    • 著者名/発表者名
      油井誠、小島功
    • 学会等名
      Webとデータベースに関するフォーラム(WebDB Forum 2010)
    • 発表場所
      早稲田大学理工学術院
    • 年月日
      2010-11-12
  • [学会発表] Nb-GCLOCK : A Non-blocking Buffer Management based on the Generalized CLOCK2010

    • 著者名/発表者名
      油井誠
    • 学会等名
      第7回 先端的データベースとWeb技術動向講演会(ACM SIGMOD日本支部第44回支部大会)
    • 発表場所
      東京工業大学大岡山キャンパス
    • 年月日
      2010-06-12
  • [産業財産権] 表データのデータ処理方法、データ処理システムおよびそのコンピュータプログラム2010

    • 発明者名
      油井誠
    • 権利者名
      独立行政法人産業技術総合研究所
    • 産業財産権番号
      特許、特願2010-232069
    • 出願年月日
      2010-10-15

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi