研究課題/領域番号 |
19024050
|
研究種目 |
特定領域研究
|
配分区分 | 補助金 |
審査区分 |
理工系
|
研究機関 | 大阪大学 |
研究代表者 |
松田 秀雄 大阪大学, 大学院・情報科学研究科, 教授 (50183950)
|
研究分担者 |
竹中 要一 大阪大学, 大学院・情報科学研究科, 准教授 (00324830)
|
研究期間 (年度) |
2007 – 2008
|
研究課題ステータス |
完了 (2008年度)
|
配分額 *注記 |
6,200千円 (直接経費: 6,200千円)
2008年度: 3,100千円 (直接経費: 3,100千円)
2007年度: 3,100千円 (直接経費: 3,100千円)
|
キーワード | 異種データベース / Webサービス / ワークフロー / データグリッド / 情報システム / バイオインフォマティクス / 大規模ファルシステム |
研究概要 |
本研究では、広域に散在し、大容量化かつ多様化する科学データに対するスケーラブルな情報統合とそれにより得られる異分野科学データベースの横断的検索を、データグリッド技術を基盤としたワークフローによる動的な統合として実現した。 ワークフローに基づく動的なデータベース統合の評価では、データベースの検索を行うサーバ間を接続するためのデータ転送サービスを考案し、この機能を含めたデータベース統合システムを開発した。複数のデータベースをつないで順次統合するワークフローの処理で、従来法では前段のサーバの出力をクライアントに返す必要があったが、提案する方式ではデータ転送サービスを経由して後段のサーバに直接転送することで通信の効率を上げる。これにより、100HBのデータ転送時間が従来法だと277.3秒かかっていたものが、提案法では3.2秒で短縮できた。 スケーラブルなデータベース統合基盤の実現では、データ転送サービスマネージャを導入することで、データ転送サービスの転送の中継・集約を可能とするとともに、中間データ量を絞込みを行えるようにした。従来のワークフローエンジンでは、データベースサーバへの問合せ結果がすべてエンジンに返ってきてしまいメモリオーバフローが発生した。これに対して、データ転送マネージャの導入により、問合せ結果の統合はデータ転送サービスとそのマネージャの問で行われ、エンジンは統合結果だけを受け取るだけとなり、従来のワークフローエンジンでは処理が困難であった700ゲノムの比較ゲノム解析を実行することに成功した。
|