2015 Fiscal Year Annual Research Report
遺伝子の配列多様性に基づく新規メタゲノムデータ解析手法の確立
Project/Area Number |
15J08604
|
Research Institution | The University of Tokyo |
Principal Investigator |
平岡 聡史 東京大学, 理学系研究科, 特別研究員(DC1)
|
Project Period (FY) |
2015-04-24 – 2018-03-31
|
Keywords | メタゲノム解析 / バイオインフォマティクス / 温泉 / 原核微生物 / 手法開発 |
Outline of Annual Research Achievements |
近年、環境微生物のDNA配列を網羅的に取得するメタゲノム解析が広く行われるようになっている。一般的なメタゲノム解析では「種分類による群集構造解析」と「機能遺伝子組成比解析」の2つが主な解析内容であるが、このような解析では、例えば遺伝子の順序が広く集団中に保存されているのかどうか、あるいは任意の遺伝子が単一の種由来なのか複数の種間で広く共有されているのか等を解析することが難しく、環境微生物生態の全容を議論するには不十分である。本研究では、遺伝子順序や遺伝子コーディング領域の配列多様性を情報量として利用した、メタゲノムショットガンリードデータの新規解析手法の開発を目標としている。 現在、遺伝子順序をグラフ構造に落としこむ一連の処理プロセスや、遺伝子コーディング領域の配列アライメントを行うプロセスに関しては実装を終えており、パイプラインの大枠の開発は概ね完了している。現在、得られた結果から興味深いゲノム領域や遺伝子を検出する手法の開発と実装を行っており、また平行して、より最適なパラメータ選択や実装の洗練化を行うため、複数のシミュレーションデータを用いた性能評価を行っている。 同時に、本手法を適用するための実データを取得するため、環境微生物サンプリングとゲノムシーケンシングを平行して行っており、本年度は微生物のサンプリングとゲノムDNAのサンプル調整を行った。本提案手法では微生物多様性が高い環境のデータでは解析が困難になることが予想されたため、微生物多様性が低い環境サンプルとして、高い温度(50~90℃)と低いpH(1~2)に特徴づけられる一種の極限環境である、群馬県草津温泉の源泉域の土壌を選定した。サンプリングはすでに完了しており、現在、得られたサンプルからの効率的な微生物ゲノムDNA抽出の実験プロトコルを探索中であり、次年度では、実際にショットガンシーケンスを行う予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
遺伝子順序をグラフ構造に落としこむ一連の処理プロセスや遺伝子コーディング領域の配列アライメントを行うプロセスに関しては、すでに計算機上で処理するための実装を終えており、パイプラインの大枠の開発は概ね完了していると考えている。現在、得られた結果から興味深いゲノム領域や遺伝子を検出する手法の開発と実装を行っており、また平行して、より最適なパラメータ選択や実装の洗練化を行うため、複数種由来のコンプリートゲノムを用いた複数のシミュレーションデータを作成し、これらを用いて性能評価と実装開発を行っている。 また、本来は3年目に行う予定であった環境サンプリングとシーケンスによる実データの取得であるが、大阪大学微生物病研究所にてPacBio RSⅡによるショットガンリードのシーケンスを外注する目処が付いたため、計画を前倒しする形で環境微生物サンプルのサンプリングとサンプル調整を本年度中に行った。本提案手法では微生物多様性が高い環境サンプルのデータでは解析が困難になることが予想されるため、微生物多様性が低いサンプルとして、高い温度(50~90℃)と低いpH(2~1)という極限環境の一種である、群馬県草津温泉の源泉域の土壌を選定した。草津町役場の協力もあり、サンプリング自体は滞り無く完了し、十分量と考えられる程度のサンプルを研究室にストックすることができたが、今回選定したサンプルが非常に特殊な成分組成(硫黄化合物や金属イオン類の高い含有量)を持つため、一般的なゲノムDNA抽出手法では抽出が困難であることがわかり、より効率的なゲノムDNA抽出の実験プロトコルを現在探索中である。
|
Strategy for Future Research Activity |
データ処理パイプラインの開発や各種パラメータ調整を今後行っていく予定である。これらの開発や調整が終了次第、複数の属を含む単離株由来のゲノムデータを用いて、より現実の微生物生息環境に近いシミュレーションデータを複数作成し、それらを用いて本手法の性能評価を大規模に行っていく予定である。また合わせて、将来的にソフトウェアパッケージとして公開し一般の研究者に利用してもらうことを考えているため、直感的な操作や解釈が容易な出力を行えるように、高いユーザビリティをもつ実装に順次改修していく予定である。 メタゲノムシーケンスに関しても、次年度中には温泉サンプルからの効率的な微生物DNA抽出方法を確立し、実際にPacBio RS Ⅱによるロングリードのショットガンシーケンスを行う予定である。さらに、得られたシーケンスデータを上記の新規解析手法を用いて解析し、結果を評価する予定である。これに平行して、解析を行うための計算機環境の整備や設備拡充を順次行っていく予定である。
|
Research Products
(8 results)