研究概要 |
現在、生命現象に関する多様な情報がゲノム配列、分子構造、相互作用、細胞、組織、固体などの各階層から多量に発生しており、これらの情報から知識を体系化するための研究にすすみつつある。しかし,これらの情報の多くはばらばらにデータベース化されており、研究の多様化に対応できる付加価値データベースや知識ベースの開発や知識を抽出するための情報解析技術の開発が切望されている。そこで本研究では、生命現象にかかわるさまざまな情報を分子レベルに集約しお互いの関係を解析できるような統合データベースを構築し、そこから知識を抽出するための技術を開発した。これまでに、配列、構造、機能、物性データを統合したバックボーンデータベース、3DinSight、を開発したが、データの収集・統合を継続するとともに、検索や可視化インターフェイスなどの機能強化を行った。機能情報については、新たに発生した病気に関連するアミノ酸変異情報を収集し、蛋白質3次元構造上にマップした。また、検索機能の改良を行った。蛋白質の熱力学データに関しては、本年度約2,200件を収集し、全体で15,500件余りとなった。蛋白質と核酸の相互作用データに関しては、本年度約500件を収集し、全体で3,500件余りとなった。これらのデータを用いて、構造と熱力学量との相関についての研究を行った。また、配列、相互作用、構造情報を用いた転写因子のターゲット予測法の開発を行った。蛋白質・リガンド相互作用データに関しては、本年度約2,000件を収集し、全体で22,000件余りとなった。これらのデータを用いて構造・活性相関の研究を行った。また、文献からのデータ抽出の効率化、自動化や、データの標準化、オントロジーなどの研究をすすめた。
|