2019 Fiscal Year Final Research Report
Development of a metagenomic analysis method that enables whole-genome construction from metagenome using the Hi-C method
Project/Area Number |
18K19286
|
Research Category |
Grant-in-Aid for Challenging Research (Exploratory)
|
Allocation Type | Multi-year Fund |
Review Section |
Medium-sized Section 43:Biology at molecular to cellular levels, and related fields
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
Itoh Takehiko 東京工業大学, 生命理工学院, 教授 (90501106)
|
Project Period (FY) |
2018-06-29 – 2020-03-31
|
Keywords | Hi-C法 / メタゲノム |
Outline of Final Research Achievements |
The Hi-C method is developed for analyzing the higher-order structure of chromosomes. The purpose of this study was to apply the Hi-C method to metagenomic analysis and binning after metagenome assembly. We succeeded in developing a binning tool exceeding the existing methods in terms of accuracy. This tool uses continuous sequences (scaffolds) assembled by the metagenomic assembler and Hi-C-derived sequence data as an input and provides the binning result as an output. First, the paired-end sequence data derived from the Hi-C method are mapped to the scaffolds. Then, a graph with each scaffold sequence as nodes and links by the paired Hi-C data as edges is created, and this graph is then solved using the Infomap method. We also confirmed the practical applicability of this method by applying it to newly acquired metagenomic data of the bovine rumen.
|
Free Research Field |
ゲノム情報
|
Academic Significance and Societal Importance of the Research Achievements |
ある環境を構成する個々の細菌ゲノムの再構築を目指したメタゲノムアセンブルは幅広く実施されているが、その鍵となるのは情報解析手法である。一般的には、シークエンスデータをアセンブル後、得られた配列を特徴量に基づいてクラスタリングすることで分類し、個々の細菌ゲノムの再構築を目指す。様々なクラスタリング手法が開発されているが、アセンブル配列が短い場合には特徴量抽出が困難となり、精度高くクラスタリングすることは原理的に難しい。その点本研究で取り扱うHi-Cデータはアセンブル長に依存しないため、新たな情報量を付与することが可能となり、既存手法との組み合わせによりブレークスルーを与えることが期待される。
|