研究課題/領域番号 |
21K06130
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分43050:ゲノム生物学関連
|
研究機関 | 大学共同利用機関法人情報・システム研究機構(機構本部施設等) (2023) 地方独立行政法人静岡県立病院機構静岡県立総合病院(救急診療部、循環器病診療部、がん診療部、臨床診療部 (2021-2022) |
研究代表者 |
小杉 俊一 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任准教授 (30365457)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2024年度: 260千円 (直接経費: 200千円、間接経費: 60千円)
2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2021年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | 挿入 / ゲノム / 構造変異 / 全ゲノムシークエンシング / アンマップ / ゲノムシークエンシング / unmapped read / ヒトゲノム |
研究開始時の研究の概要 |
全ゲノムシークエンシングデータにおいてリファレンスゲノムにマップされないアンマップリードには、ウイルスなどの他生物由来配列のゲノムへの挿入に由来するものを含む。このような未知の挿入配列は、挿入部位周辺の遺伝子の機能に影響を与えるだけでなく、挿入配列から異種遺伝子が発現される可能性があり、ヒト疾患を含めた生命制御の新たな制御機構の発見に繋がる可能性がある。本研究では、疾患サンプルを含む一万人規模のヒト全ゲノムシークエンシングデータから抽出したアンマップリードをヒト以外の全塩基配列データベースに対してアライメントを行い、未知生物由来のゲノム挿入配列、挿入部位を同定する。
|
研究実績の概要 |
1000 Genomes Projectハイカハレッシヒト全ゲノムシークエンス(WGS)データ(3,202サンプル)およびDDBJ WGSデータ(8,498サンプル)からの総計11,700 WGSデータから抽出したunmappedリードをRefSeqデータベースにMinimap2を用いてマッピングを行い、アライメントデータを取得した。Viralのアライメントデータから、1 Kb以上のアライメント長を示すRefSeqターゲット配列を抽出した。これまで報告のあったヒトヘルペスウイルス(HHV)6A/6Bについては、約106 Kbのウイルスゲノム挿入と考えられるものがHHV-6Aで45サンプル(0.38%)、HHV-6Bで30サンプル(0.26%)に検出された。この他に、ヒトT細胞白血病ウイルスゲノム約8.2 Kb断片が4サンプルに、リスザルレトロウイルスゲノムの約9 Kb断片が12サンプルに、シタツンガウシ内在レトロウイルスK1ゲノム約2.9 Kb断片が78サンプルに検出された。これらの検出されたウイルスゲノム断片の平均アライメントリードカバレッジは、いずれも5×以上であったため、ウイルスゲノム断片のヒトゲノムへの挿入であることが推測される。 また、挿入配列候補のゲノムへの挿入部位を決定するための既存ツールの調査を行なった。挿入部位はショートリードWGSデータの構造変異検出ツールを用いることで検出でき、最終的に挿入部位候補領域をPCR増幅し、ロングリードシークエンシングを用いて目的の挿入部位を決定する。今回、ショートリードを用いた挿入部位検出ツールについて性能評価を行ったところ、MOPlineやINSurVeyorがロングリードを用いた挿入部位検出ツールと同等の性能を発揮することが示された。この性能評価試験結果は今年のHuman Genome Variation誌で発表を行なった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
昨年の6月に静岡県立総合病院からデータサイエンス共同利用基盤施設・ゲノムデータ解析支援センターに異動になり、新規の職務に追われて本研究に従事する時間が無くなったことが進捗の遅れの大きな要因である。
|
今後の研究の推進方策 |
入手可能な公共の全ゲノムシークエンシング(WGS)データを本研究の解析に加えていく計画である。現在、パーキンソン病のデータリソースであるAMP PDにデータ解析の申請を進めており、申請が通れば3千以上のWGSデータを解析可能となり、パーキンソン病発症に関わる非ヒト由来ゲノム挿入の同定を試みる。また、現在使用しているRefSeqデータベースは2年以上前のもので、現在のRefSeqデータは更新されてより多くの配列が登録されている。このため、現在のRefSeqデータをダウンロードし、unmappedリードのアライメントを取り直す計画である。
|