研究課題/領域番号 |
20K15769
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分43050:ゲノム生物学関連
|
研究機関 | 東京工業大学 |
研究代表者 |
梶谷 嶺 東京工業大学, 生命理工学院, 助教 (40756706)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
中途終了 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | ゲノム / ハプロタイプ / ヘテロ接合度 / メタゲノム / ヘテロ接合性 / NGS / 多様性 / ゲノム多様性 / 高ヘテロ接合性 / de novoアセンブリ |
研究開始時の研究の概要 |
多数種のゲノムデータの蓄積に伴い、ヘテロ接合性が1%を超えるような「超高ヘテロ接合性生物」が多くの系統で発見されるようになったが、その実態は不明な部分が多い。本研究ではバイオインフォマティクスに基づき、(i) 地球上での超高ヘテロ接合性生物の種類数と量の実態把握、(ii) 当生物の多個体のゲノムデータの解析技術の開発、(iii) 当生物のモデル生物化の促進、を目的とする。方法としては、公開シークエンシングデータの網羅的な再解析、および高ヘテロ接合性領域への対処として有効なハプロタイプ解析技術の開発を主軸とする。
|
研究実績の概要 |
研究期間の初期では多個体ハプロタイプ解析用の効率的な配列決定手法の開発を実施した。方針としては、ハプロタイプの新規配列構築ソフトウェアであるPlatanus-allee(Kajitani et al. 2019)を発展させ、より低コストに解析を可能とすることを目指した。更にアルゴリズムの抜本的な改良として、ロングリード内のエラーの無い領域をショートリードを駆使して検出し、その結果を活用して配列延長を行うツールも所属研究室の大学院生と共同で開発した(石井ら、第9回生命医薬情報学連合大会、2020)。二年度目以降では、多数の微生物のハプロタイプが混在した微生物叢のメタゲノムデータは開発ツールのテストに適しており、本研究の成果の応用先にもなることが見いだされた。そのため微生物叢のデータを用いて開発を推進し、類似した配列の誤接続を防ぎつつゲノム配列を決定可能なツール: MetaPlatanusを実装し論文発表した (Kajitani et al. 2021)。並行して近年に使用例が増加している、DNA分子の空間的な近接関係を捉えるHi-C法や、エラー率の低いロングリード技術であるHiFiリードの利用の検討も行った。 最終年度はDNA分子の空間的な近接関係を捉えるHi-C法のデータを活用したハプロタイプ構築手法の開発を継続した。前年度までに開発したde Bruijnグラフ構造を操作するツールを応用し、入力配列の相同領域を効率よく対応づけることで、最終的な配列を安定して染色体スケールにすることができた。また、公開データを用いたヘテロ接合度の推定パイプラインを開発し、さらに他の大型ゲノム決定プロジェクトのデータに関しても調査を実施し、高ヘテロ接合性 (>1%) のサンプルが予想通り多く存在することを見出した。
|