研究課題/領域番号 |
15607013
|
研究機関 | 大阪大学 |
研究代表者 |
松田 秀雄 大阪大学, 大学院・情報科学研究科, 教授 (50183950)
|
研究分担者 |
伊達 進 大阪大学, 大学院・情報科学研究科, 助手 (20346175)
|
キーワード | グリッドコンピューティング / ゲノムデータベース / データベース連携 / XML / 知識ベース / ゲノム情報解析 / データ検索インターフェース / バイオインフォマティクス |
研究概要 |
ゲノムに関するデータは、DNA塩基配列はDDBJ/EMBL/GenBank、タンパク質配列はPIRやSWISS-PROT、タンパク質立体構造はPDBというように、スキーマやフォーマットの異なる別々のデータベースに分散されて格納されている。さらに、データの種類やデータベース構築の目的に応じて別々のデータベースが構築されており、その数は500個を超えているとされている。このように大量のデータから有用な知見を得るためには、従来のデータベースの機構だけでは対応が困難となってきており、新たなデータベース管理と検索手法の開発が緊急の課題となっている。そこで、本研究では、このように多数の大規模ゲノムデータベースをグリッド技術による連携させた連携型ゲノム知識ベースの構築を目的として、以下の研究項目を実施した。 1.XMLに基づくゲノムデータ形式およぶデータ検索インターフェースの設計 ゲノムデータが分散して格納されている各種データベースの形式からXMLに基づく形式への変換系を開発することにより、データベースごとの表現形式の違いを吸収した。また、ゲノムデータに対する検索インターフェースを設計し、そのインターフェースに基づくデータ検索系を開発した。 2.ゲノム知識ベースの設計・開発 ゲノムデータの種類とそれらの持つ属性や他のデータとの関連性を、そのデータ固有の知識と共に体系的に表現できるゲノム知識ベースを設計・開発した。 3.グリッドコンピューティングによるデータベース連携インターフェースの開発 複数のデータベースにまたがるデータ検索を可能にするため、グリッドコンピューティングによるデータベース連携インターフェースを設計し、実際に代表的なゲノム関連データベースを相互に連携するシステムを開発した。
|