研究課題/領域番号 |
17K07255
|
研究機関 | 関西医科大学 |
研究代表者 |
日笠 幸一郎 関西医科大学, 医学部, 教授 (10419583)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | ヒトゲノム構造多様性 |
研究実績の概要 |
初年度の研究により、ヒトゲノムの参照配列を新規に構築する上で、ヒトハプロイドゲノムである胞状奇胎の利用は精度的にも効率的にも極めて適していることが証明されたことから、更に高精度のヒトゲノム参照配列の構築を目指し、第3世代のシークエンサーPacBioシステムおよび10X genomicsのGemCode技術を用いて長鎖のシークエンスデータを追加することにした。本年度は、PacBioのデータ取得が完了し、昨年度までに構築してきた参照配列との統合解析を進めている。現在、10X genomicsのデータ取得も進行中であり、これらのデータを統合することで、より完成度の高い参照配列の構築が期待される。一方で、参照配列の高次元化に利用する日本人3,000人の全ゲノムシークエンス解析については、データの収集が完了し、ゲノム上の変異情報の抽出作業に移行した。参照配列のグラフ化において特に有用であるゲノム構造変異は、計44万か所が検出されており、これらの構造変異を現在のヒトゲノム参照配列へ統合することによる高次元化を進めている。今後は、公共のデータベースに登録されているグローバルな人種から同定された構造変異情報を高次元化に用いた場合との比較解析によって人種特異的な高次元参照配列の有用性について検証するとともに、高次元化に基づく構造変異周辺のリードアライメントの改善度や一塩基変異や構造変異自体の検出精度についても精査し、継続的な変異情報統合プロセスの重要性について検討を進める予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
初年度の研究により、ヒトゲノムの参照配列を新規に構築する上で、ヒトハプロイドゲノムである胞状奇胎の利用は精度的にも効率的にも極めて適していることが証明されたため、更なる高精度のヒトゲノム参照配列の構築を目指し、第3世代のシークエンサーPacBioシステムおよび10X genomicsのGemCode技術を活用した長鎖のシークエンスデータの取得が順調に進んでいる。また、参照配列の高次元化に利用する3,000人の全ゲノム情報についても、全ゲノムシークエンスによるデータ取得およびグラフ構造の構築に必要なゲノム上の変異情報(構造変異を含む)の抽出が完了し、変異情報に基づく参照配列のグラフ構造化とその有用性についての検討が進んでいるため。
|
今後の研究の推進方策 |
ヒトゲノム参照配列を新規に構築する上で土台となるヒトハプロイドゲノム胞状奇胎の利用は精度的にも効率的にも極めて適していることが判明したため、更に高精度のヒトゲノム参照配列の構築を目指し、第3世代のシークエンサーPacBioシステムおよび10X genomicsのGemCode技術を用いて長鎖のシークエンスデータの統合解析を進める。また、高次元参照配列の有用性については、日本人3,000人の全ゲノム情報およびディープニューラルネットワーク(人工知能)等の技術活用も視野に入れ検討を進める。
|
次年度使用額が生じた理由 |
本年度までの研究により、全胞状奇胎を用いた新規の日本人参照配列(De novo assembly)が、予想を上回る高い精度で構築可能であることが判明し、更なる精度の向上を目指して、長鎖のシークエンスデータを補充することにした。また、高次元参照配列の有用性を検討においては、人工知能の活用が有効である可能性が示唆された。従って、データ量の拡充に伴うストレージやアセンブリ計算量の増加、及び、人工知能の研究開発に必要なスペックの計算機を準備するため、当該年度と翌年度の予算を合わせて解析に必要な計算機を導入する計画にした。本対応により、本課題研究の一層の推進が期待される。
|