2014 Fiscal Year Research-status Report
メタゲノミクスと数理統計学の融合による新規な環境影響評価法の開発
Project/Area Number |
26550053
|
Research Institution | Japan Agency for Marine-Earth Science and Technology |
Principal Investigator |
高見 英人 独立行政法人海洋研究開発機構, 海底資源研究開発センター, 上席研究員 (70359165)
|
Co-Investigator(Kenkyū-buntansha) |
竹本 和広 九州工業大学, 大学院情報工学研究院, 助教 (40512356)
|
Project Period (FY) |
2014-04-01 – 2016-03-31
|
Keywords | 環境影響評価 / 環境メタゲノム / KEGG / 機能モジュール / 生理代謝 |
Outline of Annual Research Achievements |
本研究課題“メタゲノミクスと数理統計学の融合による新規な環境影響評価法の開発”では、大型生物の死滅や個体減少を基準とした海洋における環境影響評価法を一変し、普遍的に存在する微生物群集のメタゲノム配列情報に基づく環境影響評価を可能とすることを目的としているが、平成26年度は、まず、それに必要なメタゲノム配列情報に由来する生物の機能を数値したデータセットの作成を行った。 具体的には、Venter研究所が中心となって行ったグローバル海洋サンプリングプロジェクトで採取された、サルガッソー海及びガラパゴス諸島近海、4サイトのメタゲノム配列データ(約120~140万配列)から研究代表者らが開発中の生理・代謝機能ポテンシャル評価システム、MAPLEを用いて、エネルギー代謝、中央代謝や環境応答、物質輸送などに関わる機能のポテンシャルを、各反応単位でモジュール化された機能の充足率(MCR %)という形で数値化した(課題1)。 また、数値化されたMCRの統計的な偏りによる過大/過小評価を補正するための指標として、Q値 (significance) の計算手法の開発を行った。Q値の計算は、1. KEGGから公開されている機能モジュールの構成の特徴。2. ホモロジーサーチ時に得られたスコアー(類似度の優位性)。3. モジュールを構成する遺伝子(KO)の存在度。この3点を考慮して行った。KOの存在度は、KOがアサインされたメタゲノム中の配列数を各KOの平均長で標準化した数値を算出し、その値を各KOの存在度として用いた(課題2)。 これらの結果、充足率が100%に満たない機能モジュールでもQ値の優位性から、機能ポテンシャルの存在を優位に示唆できることがわかった。また、このQ値の優位性を示すには、対象とする環境にもよるが、300万配列の遺伝子セットがあれば問題ないことがわかった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題は、4つのサブ課題からなっているが、その最初の課題であるメタゲノム配列に潜む機能ポテンシャルの数値化データセットの作成については、平成26年度で終了した。これは、本研究で申請した計算ノードの増設とシステムの最適化がスムーズに進んだことによる寄与が非常に大きかった。平成26年度はグローバル海洋サンプリングプロジェクト以外で、研究代表らが採取した深海底サンプルの計算も行い、極端に異なる環境間での比較も可能となっている。 課題2の生物-環境相互作用の抽出・定量化法では、生理・代謝機能ポテンシャルの定量化法の開発を、機能モジュールの充足率の過大/過小評価を補正するためのQ値 (significance) の計算手法の開発を中心に行い、平成26年度でほぼ終了した。現在は、これらの研究課題の成果を総括し、課題3の実環境の生態系をデザインする逆生態学的方法の開発に必要なモデル事例を現在検討中である。
|
Strategy for Future Research Activity |
平成27年度は、平成26年度に行った課題1、課題2の結果をもとに、実環境の生態系をデザインする逆生態学的方法の開発に着手する。平成26年度は主にメタゲノム配列データを用いて、生理・代謝機能の数値化を行ったが、平成27年度は、ゲノムが既読な生物種の生理・代謝機能の数値化を行い、個別生物種データセットを構築する。 実環境の生態系には、既知ゲノム生物種との類似性が極めて低い生物種が多く含まれているので、ゲノムが既読生物種の各機能モジュールに対する充足率やそれを補正するQ値のパターンから、既読生物種を分類する。この結果と平成26年度のメタゲノム配列中の生物種の割合などを考慮して、実環境の生態系をデザインする方法論を開発する(課題3)。また、各生理・代謝機能のモジュール存在度の度合い(richness)とそれを担う生物種の多様性の度合い(evenness)を数値化し、課題4で行う環境維持力・復元力を予測する方法の開発へとつなげる。
|
Causes of Carryover |
論文の投稿料として予定していたが、解析に予想以上の時間を要し論文の投稿が遅れたため、次年度に使用することとした。
|
Expenditure Plan for Carryover Budget |
現在論文投稿中なので、アクセプト後に支払う投稿料や研究打ち合わせなどに必要な旅費などに使用する計画である。
|
Research Products
(3 results)