研究課題/領域番号 |
21K06130
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分43050:ゲノム生物学関連
|
研究機関 | 地方独立行政法人静岡県立病院機構静岡県立総合病院(救急診療部、循環器病診療部、がん診療部、臨床診療部 |
研究代表者 |
小杉 俊一 地方独立行政法人静岡県立病院機構静岡県立総合病院(救急診療部、循環器病診療部、がん診療部、臨床診療部, リサーチサポートセンター, 研究員 (30365457)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2024年度: 260千円 (直接経費: 200千円、間接経費: 60千円)
2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2021年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | ゲノムシークエンシング / 挿入 / 構造変異 / unmapped read / ヒトゲノム / 全ゲノムシークエンシング |
研究開始時の研究の概要 |
全ゲノムシークエンシングデータにおいてリファレンスゲノムにマップされないアンマップリードには、ウイルスなどの他生物由来配列のゲノムへの挿入に由来するものを含む。このような未知の挿入配列は、挿入部位周辺の遺伝子の機能に影響を与えるだけでなく、挿入配列から異種遺伝子が発現される可能性があり、ヒト疾患を含めた生命制御の新たな制御機構の発見に繋がる可能性がある。本研究では、疾患サンプルを含む一万人規模のヒト全ゲノムシークエンシングデータから抽出したアンマップリードをヒト以外の全塩基配列データベースに対してアライメントを行い、未知生物由来のゲノム挿入配列、挿入部位を同定する。
|
研究実績の概要 |
1000 Genomes Project(1KG)ハイカバレッジヒト全ゲノムシークエンス(WGS)データ(全3,202サンプル)のリファレンスにマップされていないリード (unmapped reads)を1KG ftpサイトから直接抽出し、NCBIからダウンロードしたRefSeqデータ ベース(viral, bacteria, archaea, protozoa, fungi, plant, invertebrate, vertebrate_other)にMinimap2を用いてマッピングを行った。各リードは由来するサンプルの情報に関するタグ付けされているため、検出された挿入部位がどのサンプル由来かを識別できる。現在挿入部位を効率的に精度良く検出するためのソフトウェアを開発中である。特にpaired-end readsの片方しかレファレンスにマッピングされない場合のデータの処理や同じリードが複数のリファレンスにマッピングされた場合の処理を組み入れる必要がある。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
マッピングデータから挿入部位を効率的に精度良く検出するためのコンピュータープログラムの作成の段階で時間を要してしまっている。また、より多くの全ゲノムシークエンシングデータを用いて解析したいため、海外のデータベースへの利用申請等に時間を要している。
|
今後の研究の推進方策 |
UK BioBankの全ゲノムシークエンシングデータを利用出来るよう準備を進めている。このデータを利用することで総計2万人以上のデータを解析することが出来るため、興味ある挿入を見つけることが出来る確率が高くなる。また、unmapped readsのマッピングツールをMinimap2以外のツールを用いて解析することも検討する。
|