研究概要 |
本研究では,多様なゲノムXMLデータを統合的に管理し,それらデータの横断的な検索やナビゲーション機能を提供する汎用的なXMLデータの構築方法,XMLデータベースの利用者インタフェースの開発,および更新が多い多様なDTDやXMLスキーマに基づくXMLデータを効率良く管理可能なデータ構造の開発を行った. 実際に提供されているXMLデータは,横断検索に適した論理構造を有するとは限らない.そこで,種々の論理構造を有するXMLデータからキーワード集合などの簡易問合せにより,最適な部分XMLデータを検索するための手法を研究・開発し,XMLデータの簡易検索を可能とするシステムのプロトタイプを作成した.また,その評価を行うために,INEX (Initiative for the Evaluation of XML retrieval)国際イニシアティブに参画し,テストコレクションを作成した. ゲノムデータは更新の頻度が高いために,検索,更新ともに効率よく実行可能なXMLデータ索引の開発が必要である.したがって,XMLの木構造を表現する符号化方法について研究し,そのためのノード符合化法として,rUID, QRSなどを考案した. MaXML (Mouse annotation XML)などGene Ontology (GO)を参照する複数のゲノムXMLデータを,GOを中心に統合し,同じ働きを持った異なる生物種間の遺伝子の比較を行い,SVGを用いて表示するデータベースシステムGeneAroundを構築しGOデータの更新に追随させた.GeneAroundシステムは,理化学研究所のマウス遺伝子注釈付けプロジェクトFANTOMでも実際に利用された.また,海外からのWebサイトへのアクセスも増加している.
|