研究課題/領域番号 |
26440193
|
研究機関 | 北海道大学 |
研究代表者 |
遠藤 俊徳 北海道大学, 情報科学研究科, 教授 (00323692)
|
研究期間 (年度) |
2014-04-01 – 2018-03-31
|
キーワード | 比較プロテオームデータベース / 生物系統 |
研究実績の概要 |
多種生物にまたがる比較オミックス統合データベースの開発を目指し、過去にバイオインフォマティクス推進事業の支援を得て構築したホヤ統合プロテインデータベースCIPROのデータ解析スキームを飛躍的に発展させるため、公共データバンクにて公開されている314種の動物ゲノムデータを中心に系統を行い、全動物門を横断する形にプロテオームデータの整備を進めた。前年まではアノテーション名の比較に基づいた遺伝子分類を行ってきたが、アノテーションに問題があることが判明したため、参照データベースとして最もアノテーション信頼性が高いとされるSwissProtを対象とする相同性再解析を行い、全対象生物ゲノムについて遺伝子スペクトラムの構築を進めた。各生物の持つ遺伝子は1万6千~4万程度であるが、すべてを網羅する遺伝子数は8万程度となった。入手したゲノムデータのいくつかについて機能モチーフ探索および遺伝子オントロジーに基づいてカテゴリ分類および標準化を行い、生物種毎の遺伝子スペクトル作成を行った。系統固有の遺伝子は期待したよりは少なく、同一系統内の異種間での差異が大きい傾向が見られた。この膨大な結果をデータベースとして公開するほか、より全体像を俯瞰できる形に集約を進め、生物のもつ遺伝子スペクトラムの系統間共通性と特異性をより明確に浮き彫りにすることを目指し、引き続き、遺伝子スペクトラムに基づいて生物特性を表現する新しい方法を確立することを目指したいと考えている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
ゲノム・プロテオームデータはNCBI,EBI,UCSCの3カ所に蓄積されているが、配列データとしてはNCBIが大半をカバーし、EBIがアノテーションの多くをカバーしているものの、動物門レベルの生物系統の整備はなされておらず比較解析を難しくしている。またアノテーションの精度にはゲノムプロジェクトごとにばらつきがある。このため、いったん既存アノテーションに頼ることをやめ、独自の基準でアノテーション作成と種をまたがる遺伝子分類を進めた。今年度、学内のサーバセキュリティ対策要請が大幅に強化され、強制的に短期間対応を求められたため、当初の計画が一時中断してしまい、予定よりやや遅れることになった。
|
今後の研究の推進方策 |
データベースに蓄積した処理済データをいかに要約して視覚化するかが大きな問題である。CIPROプロジェクトで我々が初めて考案し導入したデータのグラフィック化および統合化の手法は、多くの統合データベースに取り入れられ標準となった。本研究においては、比較解析の面を強く意識したデータプレゼンテーション法の確立が最大の焦点であり、今後の標準を確率するべきものと位置づけている。
|
次年度使用額が生じた理由 |
予期せぬセキュリティ対策のため、当該年度の計画にやや遅れが出たため、研究遂行が十分に行えなかった。
|
次年度使用額の使用計画 |
データ処理結果の蓄積が急ピッチで進むようになってきており、計算およびストレージの拡充および成果発表に活用する。
|