研究課題/領域番号 |
18K19286
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分43:分子レベルから細胞レベルの生物学およびその関連分野
|
研究機関 | 東京工業大学 |
研究代表者 |
伊藤 武彦 東京工業大学, 生命理工学院, 教授 (90501106)
|
研究期間 (年度) |
2018-06-29 – 2020-03-31
|
研究課題ステータス |
完了 (2019年度)
|
配分額 *注記 |
6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)
2019年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
2018年度: 3,770千円 (直接経費: 2,900千円、間接経費: 870千円)
|
キーワード | Hi-C法 / メタゲノム / HI-C法 / ビンニング / HiC法 / メタゲノム解析 / ゲノムアセンブラ / Hi-C |
研究成果の概要 |
本研究は、染色体高次構造を明らかにする目的で開発されているHi-C法を、メタゲノム解析に応用し、アセンブル後のビンニングに活用することを目的として実施された。メタゲノムアセンブラにてアセンブルされた配列(Scaffold)に対して、Hi-C法由来のデータをマップし、各Scaffold配列をノード、Hi-Cデータによるリンクをエッジとしたグラフを作成し、Infomap法による段階的な分割を行うことで、既存手法を上回るビンニング精度を持ったツールの開発に成功した。また、本ツールを新規に取得したウシ・ルーメンのメタゲノムデータに適用し、その実用性を確かめた。
|
研究成果の学術的意義や社会的意義 |
ある環境を構成する個々の細菌ゲノムの再構築を目指したメタゲノムアセンブルは幅広く実施されているが、その鍵となるのは情報解析手法である。一般的には、シークエンスデータをアセンブル後、得られた配列を特徴量に基づいてクラスタリングすることで分類し、個々の細菌ゲノムの再構築を目指す。様々なクラスタリング手法が開発されているが、アセンブル配列が短い場合には特徴量抽出が困難となり、精度高くクラスタリングすることは原理的に難しい。その点本研究で取り扱うHi-Cデータはアセンブル長に依存しないため、新たな情報量を付与することが可能となり、既存手法との組み合わせによりブレークスルーを与えることが期待される。
|