2004 Fiscal Year Annual Research Report
グリッドコンピューティングによる連携型ゲノム知識ベースの構築
Project/Area Number |
15607013
|
Research Institution | Osaka University |
Principal Investigator |
松田 秀雄 大阪大学, 大学院・情報科学研究科, 教授 (50183950)
|
Co-Investigator(Kenkyū-buntansha) |
伊達 進 大阪大学, 大学院・情報科学研究科, 助手 (20346175)
|
Keywords | グリッドコンピューティング / ゲノムデータベース / データベース連携 / 知識ベース / ゲノム情報解析 |
Research Abstract |
ゲノムに関するデータは、DNA塩基配列はDDBJ/EMBL/GenBank、タンパク質配列はPIRおよびSWISS-PROT、タンパク質立体構造はPDBというように、スキーマやフォーマットの異なる別々のデータベースに分散されて格納されている。さらに、データの種類やデータベース構築の目的に応じて別々のデータベースが構築されており、その数は700個を超えているとされている。このように大量のデータから有用な知見を得るためには、従来のデータベースの機構だけでは対応が困難となってきており、新たなデータベース管理と検索手法の開発が緊急の課題となっている。そこで、本研究では、このように多数の大規模ゲノムデータベースをグリッド技術による連携させた連携型ゲノム知識ベースの構築を目的として、以下の研究項目を実施した。 1.オントロジーによる異なるドメインに属するデータの統合技術の開発 ゲノムに関するデータの中には、DNA、タンパク質、細胞の構成要素など、そのデータの実体としての概念のレベルで異なるドメインに属するものが存在している。これらを、単純に各データのスキーマのレベルで統合することは困難である。そこでデータのドメインごとに概念間の相互関係を共通化したオントロジーを構築し、オントロジーを介して異なるドメイン間のデータの統合を可能にする技術を開発した。 2.多数のデータベースを効率的に連携する技術の開発 多数のゲノム関連データベースを連携させるときに、連携されたデータベース間での問合せ処理過程で、大量の組合せ処理が生じる恐れがあり、効率のボトルネックとなることが示唆されていた。そこで、問合せ処理を一括して行うことで、個別の問合せで生じる組合せ処理を抑制する技術を開発した。これにより、全体の問合せ処理時間を大幅に短縮すると共に、データ量の増加に対する処理時間の増大を抑制することができた。
|
Research Products
(6 results)