Project/Area Number |
21K06130
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 43050:Genome biology-related
|
Research Institution | 大学共同利用機関法人情報・システム研究機構(機構本部施設等) (2023) Shizuoka Prefectural Hospital Organization (2021-2022) |
Principal Investigator |
小杉 俊一 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任准教授 (30365457)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)
Fiscal Year 2024: ¥260,000 (Direct Cost: ¥200,000、Indirect Cost: ¥60,000)
Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2022: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2021: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
|
Keywords | 挿入 / ゲノム / 構造変異 / 全ゲノムシークエンシング / アンマップ / ゲノムシークエンシング / unmapped read / ヒトゲノム |
Outline of Research at the Start |
全ゲノムシークエンシングデータにおいてリファレンスゲノムにマップされないアンマップリードには、ウイルスなどの他生物由来配列のゲノムへの挿入に由来するものを含む。このような未知の挿入配列は、挿入部位周辺の遺伝子の機能に影響を与えるだけでなく、挿入配列から異種遺伝子が発現される可能性があり、ヒト疾患を含めた生命制御の新たな制御機構の発見に繋がる可能性がある。本研究では、疾患サンプルを含む一万人規模のヒト全ゲノムシークエンシングデータから抽出したアンマップリードをヒト以外の全塩基配列データベースに対してアライメントを行い、未知生物由来のゲノム挿入配列、挿入部位を同定する。
|
Outline of Annual Research Achievements |
1000 Genomes Projectハイカハレッシヒト全ゲノムシークエンス(WGS)データ(3,202サンプル)およびDDBJ WGSデータ(8,498サンプル)からの総計11,700 WGSデータから抽出したunmappedリードをRefSeqデータベースにMinimap2を用いてマッピングを行い、アライメントデータを取得した。Viralのアライメントデータから、1 Kb以上のアライメント長を示すRefSeqターゲット配列を抽出した。これまで報告のあったヒトヘルペスウイルス(HHV)6A/6Bについては、約106 Kbのウイルスゲノム挿入と考えられるものがHHV-6Aで45サンプル(0.38%)、HHV-6Bで30サンプル(0.26%)に検出された。この他に、ヒトT細胞白血病ウイルスゲノム約8.2 Kb断片が4サンプルに、リスザルレトロウイルスゲノムの約9 Kb断片が12サンプルに、シタツンガウシ内在レトロウイルスK1ゲノム約2.9 Kb断片が78サンプルに検出された。これらの検出されたウイルスゲノム断片の平均アライメントリードカバレッジは、いずれも5×以上であったため、ウイルスゲノム断片のヒトゲノムへの挿入であることが推測される。 また、挿入配列候補のゲノムへの挿入部位を決定するための既存ツールの調査を行なった。挿入部位はショートリードWGSデータの構造変異検出ツールを用いることで検出でき、最終的に挿入部位候補領域をPCR増幅し、ロングリードシークエンシングを用いて目的の挿入部位を決定する。今回、ショートリードを用いた挿入部位検出ツールについて性能評価を行ったところ、MOPlineやINSurVeyorがロングリードを用いた挿入部位検出ツールと同等の性能を発揮することが示された。この性能評価試験結果は今年のHuman Genome Variation誌で発表を行なった。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
昨年の6月に静岡県立総合病院からデータサイエンス共同利用基盤施設・ゲノムデータ解析支援センターに異動になり、新規の職務に追われて本研究に従事する時間が無くなったことが進捗の遅れの大きな要因である。
|
Strategy for Future Research Activity |
入手可能な公共の全ゲノムシークエンシング(WGS)データを本研究の解析に加えていく計画である。現在、パーキンソン病のデータリソースであるAMP PDにデータ解析の申請を進めており、申請が通れば3千以上のWGSデータを解析可能となり、パーキンソン病発症に関わる非ヒト由来ゲノム挿入の同定を試みる。また、現在使用しているRefSeqデータベースは2年以上前のもので、現在のRefSeqデータは更新されてより多くの配列が登録されている。このため、現在のRefSeqデータをダウンロードし、unmappedリードのアライメントを取り直す計画である。
|