2018 Fiscal Year Research-status Report
Hi-C法を応用した細菌叢からの全ゲノム構築を可能にするメタゲノム解析手法の開発
Project/Area Number |
18K19286
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
伊藤 武彦 東京工業大学, 生命理工学院, 教授 (90501106)
|
Project Period (FY) |
2018-06-29 – 2020-03-31
|
Keywords | HiC法 / メタゲノム解析 / ゲノムアセンブラ |
Outline of Annual Research Achievements |
本年度は、従来より開発を続けているIlluminaデータを入力とするメタゲノムアセンブラの精度向上を目指した改良と、HiCデータを組み込むためのアセンブラの改良、さらにHiC実験法のサーベイを中心に研究を遂行した。 ゲノムがすでにわかっているバクテリアのゲノム20種を実際にMiseqによりシークエンスし、そのデータを計算機上で混ぜた疑似メタゲノムを用いての精度向上を目指したアルゴリズムの修正や改良を実施した。特にbinningと呼ばれるアセンブルで得られたscaffoldをクラスタリングし、個別菌と思われるデータに分ける工程の開発に時間を割き、di-codonや4mer、coverageなど様々な情報量を用いてのテストを実施した。これにより従来よりも高精度なbinningに成功した。 HiCデータの組み込みに関しては、得られたリード配列がキメラになっているため適切なマッピング方法についての検討を中心に行った。データとしては、真核生物の高次構造解析用として公開されているものを中心にダウンロードすることでプロトコルの開発に用いた。 またHiC実験法に関しては、一般的な試薬を揃えて出芽酵母を用いた実験を実施したが、様々なHiC専用キットが海外で発売されたため、それらの導入についてのサーベイを行った。これらは高次構造解析を目的として作成されたキットではあるが、基本的なHiC実験法は本研究と共通であるため、公開されているサンプルデータなどによるテスト解析などを通じ、Dovetail社のキットを導入することに決定した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究期初に立てた目標において、今年度は複数菌種を混合培養したサンプルを対象に細胞内でのin situ Hi-C法とアセンブルアルゴリズムの確立を行うことを予定していた。それに対し、混合培養はしなかったものの、単離培養したゲノムがすでにわかっているバクテリアのゲノム20種を実際にMiseqによりシークエンスし、そのデータを計算機上で混ぜた疑似メタゲノムを用いての解析を実施できた。計算機上で混合することにより、様々な組成比のデータを作成することが可能なメリットがあり、実際にほぼ均等に混ぜた例から100倍レベルでシークエンスの異なる例までを作成することで、より多様な環境に対応した解析が可能となった。 また、公開データを用いることにより多様なHiCデータを入力としたアセンブルテストを実施することもでき、次年度に実データを用いたテスト解析にすぐにでも入れる体制を整えることができた。 これらの結果から、おおむね順調に進展していると総合的に判断した。
|
Strategy for Future Research Activity |
次年度は最終年度となるため、まずHiCを用いたメタゲノム解析実験を早期に実施する予定である。対象としてはヒト腸内細菌叢を考えており、実サンプルは香川大学医学部に採取いただく予定である。ホルムアルデヒドによる固定までを香川大学で実施した後、東工大にてHiC法によるライブラリ調整を行い、通常のPair-end, Mate-pairライブラリと合わせてHiseqによるシークエンスを実施する。同時に16SrRNA解析も行い、菌種組成も確認する。 得られたシークエンスデータに対し、昨年度までに試験的に開発したメタゲノムアセンブラを適用し、その結果を評価する。幸いヒト腸内細菌叢に関しては、数多くの個別菌ゲノムが決定・公開されているため、それらを「正解」とすることで結果の評価を実施する。特にHiC法を用いる最大のメリットであるbinningにおける精度評価を重視する予定である。 続いて評価結果に基づいたアセンブラの改良を実施し、それらを繰り返すことで最終的にその時点における最高精度を持つメタゲノムアセンブラ・binningツール開発を目指す。これらの成果は、期間終了までにホームページなどからプログラムの形で公開すると共に、その内容を論文にまとめ投稿を行う予定である。
|
Causes of Carryover |
使用額に差が生じた最大の理由は、メタゲノムの実サンプルであるヒト腸内細菌叢データを取得するのに必要となる、ヒト倫理審査に時間を要してしまったためである。このため、本年度中に予定していた実データの取得ができず、公開データを利用した解析を行ったため、今年度予定していたメタゲノムシークエンス費用が大幅に節約できる形となった。 しかし、年度内に倫理審査を香川大学、東京工業大学双方で通すことができ、自分たちで取得した実データに基づいた解析を行うメリットは極めて大きいため、次年度早々にはメタゲノムシークエンスを行うことにより、シークエンス解析に主に使用する予定である。
|