2020 Fiscal Year Annual Research Report
Development of an analysis pipeline for allele-specific genome dynamics based on haplotype sequences
Project/Area Number |
18K14624
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
梶谷 嶺 東京工業大学, 生命理工学院, 助教 (40756706)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | ハプロタイプ / アレル特異的 / 遺伝子構造アノテーション |
Outline of Annual Research Achievements |
本年度はハプロタイプ配列構築ツールにより決定された配列セットに対して、ゲノムDNAの立体構造を捉える手法であるHi-C法のデータ(DNAシークエンサーの出力)をマップして解析を行う試みを実施した。当初の目標であった各ハプロタイプに特異的な立体構造の特徴を明確に検出することはできなかったが、副次的な成果としてハプロタイプ配列を染色体スケールで決定する手法を所属研究室の大学院生と共同で開発することができた(大内ら、日本動物学会第91回大会)。ここでは、以前に開発されたハプロタイプ配列構築ツール: Platanus-alleeの途中結果であるscaffoldグラフと呼ばれるデータ構造上にHi-Cデータをマップし、同ハプロタイプ上の領域は空間的にも近接する頻度が大きいことを利用してその配列の決定(phasing)を行う機能を実装した。構築された配列のエラーをHi-Cコンタクトマップを利用して修正する機能も追加することで、大きく配列長を向上させることにも成功している。 前年度までに開発された遺伝子構造アノテーションツールも、各ハプロタイプが分けて構築された配列セットに対してのテストを所属研究室の大学院生と共同で実施した。対象サンプルとしてはヘテロ接合性が極めて高い頭索動物を選択した。その際、最初に片方のハプロタイプ配列セットに遺伝子構造アノテーションを実施し、その結果のエクソン-イントロン構造をもう片方の配列セットにアライメントを行い、更にタンパク質コード領域の完成度(インフレームストップコドンの有無など)を確認した。アライメントは複数ツールの結果を統合することで性能を向上させている。結果として75%以上の遺伝子を両ハプロタイプで全長を構築することができた。このパイプラインは、両ハプロタイプが分けて構築された配列セットに対してのアノテーションツールとして新規性を有する。
|
Research Products
(1 results)