Development of a haplotype-aware structural variant analysis method for polyploid genomes
Project/Area Number |
23K19338
|
Research Category |
Grant-in-Aid for Research Activity Start-up
|
Allocation Type | Multi-year Fund |
Review Section |
0701:Biology at molecular to cellular levels, and related fields
|
Research Institution | Utsunomiya University |
Principal Investigator |
深沢 嘉紀 宇都宮大学, バイオサイエンス教育研究センター, 准教授 (50980447)
|
Project Period (FY) |
2023-08-31 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥2,860,000 (Direct Cost: ¥2,200,000、Indirect Cost: ¥660,000)
Fiscal Year 2024: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
|
Keywords | バイオインフォマティクス / 構造変異 / ハプロタイプ / 多倍体 / ゲノム科学 |
Outline of Research at the Start |
すき間のない完全なゲノム配列取得を目標とする新たな潮流が生まれている。近年、重要だが解析に労を要した複雑なゲノムも対象となってきた。しかし、構造変異と呼ばれる大規模な変異解析は、特に複雑である多倍体ゲノムなどではいまだ困難である。構造変異解析の遺伝学への貢献は近年目覚ましく、遺伝子発現や形質を解析する上で有望な対象である。変異を由来する染色体に割り当てる計算をハプロタイプフェージング(HP)というが、多様な変異型の検出でHP導入は効果を上げた。そこで、本研究ではゲノムに対して構造変異解析に関する新規解析手法の開発を行い、今後重要性が増す非2倍体ゲノム配列解析の新たな標準を目指す。
|
Outline of Annual Research Achievements |
完全長ゲノム配列取得を現実的な目標とする新たな潮流が生まれている。近年、解析に煩労を要した倍数性の高い複雑な植物ゲノム等も解析対象となってきた。しかし、構造変異と呼ばれる大規模な変異の解析は、特に多倍体ゲノムにおいていまだ困難である。本研究では多倍体ゲノムに対して構造変異解析を行う新規解析手法の開発を目的とする。初年度となる本年度では、既存手法が、主として異なる性質を持つ次世代のデータと倍数体ゲノムの組み合わせに対しどこまで有効かを検証した。 1) 検証方法として、データが充実している2倍体ヒトゲノムを計算機上で多倍体とした例を作出し、この多倍体ヒトゲノムを用いて性能計測を試みた。変異の種類により程度は異なるものの、既存手法と次世代ロングリードの組み合わせであっても一塩基多型検出等は信頼に足ることが検証できた。一方、読み取り深度の多寡が与える影響が2倍体ゲノム解析時より大きいことが観測され、高次の倍数体ほど正確な検出にはより多くのデータ量が要求されることが判明した。既存手法の中でGATK4が良好な結果を示している。 2) 新規手法として一塩基多型だけではなく構造変異など複数の変異型を考慮した手法を考案しており、変異をグラフ構造で表現したものに対してデータを再配置するアルゴリズムの実装を行なっている。検出された各変異からハプロタイプ毎にリードの分類を行う手法に取り組んだ。 3) 当初は植物の核ゲノムのみを念頭に置いていたものの、植物オルガネラゲノムも個体レベルでは多倍体とみなせることから解析対象として的確か検証した。特に、植物ミトコンドリアゲノムに関して、特徴としてハプロタイプ間でほぼ一塩基多型が見られず、構造変異のみが主として観察されることから本研究の提唱する新規手法に対して好例だと結論付けた。 研究成果の一部については、学会と原著論文で発表している。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では多倍体ゲノムに対して構造変異解析を行う新規解析手法の開発を目的とする。当初の計画に沿って、初年度となる本年度では既存の手法を選定のための解析を中心に行い、おおむね順調に推移している。検証を高速化するため、自動で実行するパイプラインの構築も行なった。本研究の提唱する新規手法の実装に関しては、扱う変異をノードとして定義するグラフ構造を考えており、各リード全体を並べ替える実装を試みている。 次年度の検証に向けたデータの取得も進めており、実データを用いた検証に向け核における多倍体ゲノムだけではなく、植物オルガネラゲノムの解析も行なった。検証中に知り得た知見が植物ゲノム科学として意義のあるものだったため、結果の一部を学会や原著論文として発表を行なった。これらの研究の進捗状況は当初の予定に沿っていることから、おおむね順調に進展していると評価した。
|
Strategy for Future Research Activity |
次世代ロングリードと多倍体ゲノムの組み合わせに関する変異検出の手法選択に対し目処がついたことから、次年度では現在実装を行なっている新規手法の性能評価を実データ等を用いて進めていく。研究の成果は、引き続き学会や原著論文として発表を行う。
|
Report
(1 results)
Research Products
(4 results)