異分野科学データベースからの大量情報統合技術の開発
Project/Area Number |
18049053
|
Research Category |
Grant-in-Aid for Scientific Research on Priority Areas
|
Allocation Type | Single-year Grants |
Review Section |
Science and Engineering
|
Research Institution | Osaka University |
Principal Investigator |
松田 秀雄 大阪大学, 大学院情報科学研究科, 教授 (50183950)
|
Co-Investigator(Kenkyū-buntansha) |
竹中 要一 大阪大学, 大学院情報科学研究科, 助教授 (00324830)
|
Project Period (FY) |
2006
|
Project Status |
Completed (Fiscal Year 2006)
|
Budget Amount *help |
¥3,500,000 (Direct Cost: ¥3,500,000)
Fiscal Year 2006: ¥3,500,000 (Direct Cost: ¥3,500,000)
|
Keywords | データグリッド / 情報検索 / 情報システム / 大規模ファイルシステム / 異種データベース |
Research Abstract |
いくつかの科学の分野で、データの激烈な増大と多様化により、その解析に極めて多くの計算時間や記憶領域などの資源が費やされていることから、本研究では、データの急激な増大に耐えうるスケーラブルなデータ処理基盤を構築することを目的として、広域に分散した多数のデータ資源を一箇所にデータを転送して集約するのではなく、そのままの位置において仮想的に統合された共有ファイルシステムとしてまとめることで、アクセスできる方式を開発した。本方式では、ファイルはグリッド上でグローバルな名前での管理が可能なファイルシステムに格納している。 さらに、データアクセスのパターンに応じて、複数のデータベースにまたがるワークフローを作成し、ワークフローをもとにデータ解析を行うことで、従来のWeb上でのデータベース検索インターフェースでは困難だった、多数のデータベースにまたがるデータアクセスのワークフローをベースとした、データ解析処理の方式を開発した。 データベース間の、データの表現形式や用語の違いなどは、個別のデータベースごとにデータの持つ意味情報を格納したメタデータで管理し、このメタデータにより複数のデータベースにまたがる半自動的なデータの関連付けを行った。 以上の方式に基づくシステムを開発し、公開されているWebサービスを使って実際に情報統合を行ったところ、特に大量のデータ転送を必要とするワークフローにおいて、個別にWebサービスを呼び出して結果を集約する従来の方式と比べて、全体のデータ転送量の削減と処理時間の短縮が見られ、本方式の有効性が確認できた。
|
Report
(1 results)
Research Products
(5 results)