研究領域 | 超地球生命体を解き明かすポストコッホ機能生態学 |
研究課題/領域番号 |
22H04894
|
研究機関 | 国立研究開発法人産業技術総合研究所 |
研究代表者 |
美世 一守 国立研究開発法人産業技術総合研究所, 生命工学領域, 産総研特別研究員 (60930451)
|
研究期間 (年度) |
2022-04-01 – 2024-03-31
|
キーワード | バイオインフォマティクス / 微生物 / メタゲノム / ゲノム / 環境微生物 / リボソームタンパク質遺伝子 |
研究実績の概要 |
本領域の主な研究対象である難培養微生物の多様性を明らかにする上で極めて重要なのが、Metagenome-assembeld genomeである。超並列シーケンサーを用いたショットガンメタゲノムデータから構築されたMetagenome-assembled genomeは微生物の多様性・機能についての知見を急速に押し広げてきた。 他方、Metagenome-assembeld genomeの構築は情報科学的に高コストかつ複雑な操作であり、その解釈には慎重を期する必要がある。例えば、反復配列やマルチコピーの配列はゲノムアセンブリ(塩基配列の繋ぎ合わせ)の誤りを誘発すること、CRISPRなどの外来性配列はビニング(繋ぎ合わせた塩基配列の分類・クラスタリング)に困難をきたすことが知られている。 以上の背景を踏まえ、今年度は、Metagenome-assembeld genomeに潜在するバイアスを丁寧に評価した。公共データベースから取得したMetagenome-assembeld genome 約19万個、Single-cell amplified genome 約2万個、単離菌株ゲノム約3000個を解析したところ、反復配列でも外来配列でもないリボソームタンパク質遺伝子もまた、Metagenome-assembled genome構築の大きな障害となっていることを発見した。さらに、ビニングアルゴリズムが前提とするバクテリアゲノムの一般的性質を、リボソームタンパク質遺伝子(の一部)はそもそもそなえておらず、そのことがMetagenome-assembled genome構築を妨げていることが見出された。 以上の知見を反映させつつ、本研究で提案するメタゲノム解析のパイプラインを構築した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
当初予定していたデータ解析のパイプラインは概ね構築できている。また、その過程で予定外の発見があり、データ解析の一層の精緻化につなげることができた。
|
今後の研究の推進方策 |
構築したパイプラインを複雑な生態系データに適用する。第一に、この手法のproof-of-conceptに適したメタゲノムデータセットを収集し、または自ら取得する。第二に、取得したデータに上記手法を適用する。
|