研究概要 |
組換えDNA技術を初めとするバイオテクノロジのめざましい発展により,あらゆる生物のゲノムに関する情報が,GenBank,EMBL,DDBJ,PIR等により,急速に蓄積されつつある.しかし,これらのデータベースではゲノム情報はユーザには平坦なテキスト・データの形式で提供され,しかもその形式は統一されておらずデータベースごとに異なっていた.また,検索機能も配列データの相同性サーチなどに限定されていた. そこで,本研究では,以下の手順でゲノム情報データベースシステムの開発を行なった. 1.データ並列論理型言語を設計し,その処理系をイーサネットで結合されたワークステーション・クラスタ上での実現. 2.1.の言語を使って,各種のデータベースの情報を統合化したゲノム情報データベースシステムの開発. 論理型言語は,述語論理に基礎を置く高度の記述能力を有しており,これを使って,オブジェクト指向のアプローチによりデータ表現の問題を解決した.さらに,膨大な容量を持つゲノム情報に対応するため,データ主体の並列処理方式であるデータ並列処理を論理型言語に導入することにより検索効率の向上を目指した.データ並列論理型言語の処理系の実現では,以前に開発したOR並列Prolog処理系を用いた. 開発されたデータベースシステムにより,相同性サーチを行なったところ,大幅な処理時間の短縮が得られ,その有効性が示された.今後は,さらに多くの解析ツールを組み込んで,データベースと統合することにより,検索と解析の一体化したより高度なデータベースシステムの開発を目指していく.
|