2019 Fiscal Year Research-status Report
ハプロタイプ配列群に基づくアレル特異的ゲノム動態解析手法の開発
Project/Area Number |
18K14624
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
梶谷 嶺 東京工業大学, 生命理工学院, 助教 (40756706)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | ハプロタイプ / アレル特異的 / 遺伝子構造アノテーション |
Outline of Annual Research Achievements |
本年度では引き続き、2倍体ゲノム中のハプロタイプを分けて構築された配列セットを用いて、アレル特異的現象を検出するためのパイプラインの開発を行った。方法としては、ハプロタイプ配列セットを参照配列として、転写産物を対象としたRNA-seqや染色体の立体構造情報を捉えるためのHi-Cといった技術の結果をマップすることが基本戦略となる。既存手法で解析困難なゲノム領域として高ヘテロ接合性領域が存在するが、ゲノム中でのそれらの割合は野生集団由来のサンプルで大きく、近交化が進んだモデル生物サンプルでは小さいケースが多い。ヘテロ接合性かつ多種類のライブラリ調整法によるデータが揃っているサンプルは公開データベース上で少数であるが、頭索動物や棘皮動物の豊富なデータを持つグループと前年度までに共同研究の機会を得ている。 活用されるハプロタイプ配列のギャップ (配列不明領域) が下流工程に悪影響を及ぼすことが判明し、その知見は代表者を含むグループが学会にて報告した (中村ら、第8回生命医薬情報学連合大会、2019)。また、特に遺伝子構造アノテーション部分での対処法についても学会で発表された (小林ら、第8回生命医薬情報学連合大会、2019)。開発された手法では、遺伝子構造アノテーション時にエクソン領域がギャップ部分に含まれるケースを想定して最終的なエクソン-イントロン構造を予測する。これを応用することで、アレル特異的な遺伝子の誤検出を減少させることができると期待される。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
本年度では引き続き、2倍体ゲノム中のハプロタイプを分けて構築された配列セットを用いて、アレル特異的現象を検出するためのパイプラインの開発を行った。方法としては、ハプロタイプ配列セットを参照配列として、転写産物を対象としたRNA-seqや染色体の立体構造情報を捉えるためのHi-Cといった技術の結果をマップすることが基本戦略となる。ハプロタイプ配列セットの構築には、前年度に代表者を含むグループで開発されたソフトウェアであるPlatanus-allee (Kajitani et al. 2019; 別研究課題の対象) を用いる方針とした。本年度は新たにHi-Cのデータを取得し、所属研究室の大学院生の協力を得て対応するソフトウェア開発を行った。このデータを用いると、本来の用途である染色体立体構造の推定のみならず、より長いハプロタイプ配列の再構築も同時に行うことができると期待される。 当初の予定より遅れている原因としては、構築したハプロタイプ配列のギャップ (配列不明領域) の影響の把握と対処に時間を費やしたことが挙げられる。Platnaus-alleeはエラー率の低いショートリード (DNAシークエンサーの結果配列のうち、300 bp以下の短いもの) を活用したときに高性能を発揮するが、構築された配列中に多くのギャップが入ることになる。それらギャップがパイプライン中の遺伝子構造アノテーション等に悪影響を及ぼすことが判明し、その対処法を代表者を含むグループで開発した (中村ら、第8回生命医薬情報学連合大会、2019)。その開発手法は効果を示したものの、開発の時間が費やされたことが遅延の要因の一つとなっている。
|
Strategy for Future Research Activity |
引き続き、前年度までに開発された遺伝子構造アノテーションツールを活用しつつ、RNA-seqやHi-Cのデータのマップによるアレル特異的現象の検出パイプラインの開発を行う。解析の障害となる配列ギャップに対しては、アノテーションツールによる対処の他に、前段階でのロングリードの活用によるギャップの削減も同時に検討する。また、Hi-Cデータを、ハプロタイプ配列構築時に使われるグラフ構造の単純化や経路探索に用いるとこにより長いハプロタイプ配列を得るソフトウェアの開発も前年度より継続して行う予定である。以上の手法開発は所属研究室の大学院生の協力を得て推進する。 テストデータとしては、共同研究の機会を得ている、頭索動物や棘皮動物を高ヘテロ接合性サンプルとして用いる。低ヘテロ接合性かつ公開データが充実している生物種としてはヒトのサンプルを対象としてテストを行う。ヒトのデータに関しては、ゲノム中のHLA領域でのアレル特異的な遺伝子発現がT細胞の活性化に役割を果たしているという最近の報告が存在しており (Gutierrez-Arcelus et al. 2020)、ゲノム配列多様性の高いその領域に特に注目し、開発手法でその現象が検出できるかどうかなどを基準に精度の評価を行う。
|
Causes of Carryover |
次年度使用額が生じた理由には、計画の遅れが主要因である。築したハプロタイプ配列のギャップ (配列不明領域) の影響への対処等に時間を費やしてしまい、新しいサンプルの入手計画の遅延も招いてしまった。現在のテストデータは共同研究のものが多く含まれるが、は本研究のために産出したものもある。また、開発ソフトウェアの汎用性の担保のためには更に多くのケースでテストが必要であるため、次年度以降にシークエンシングデータ産出のために予算を使用する予定である。
|
Research Products
(2 results)