研究課題/領域番号 |
23K11319
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分62010:生命、健康および医療情報学関連
|
研究機関 | 京都大学 |
研究代表者 |
鎌田 真由美 京都大学, 医学研究科, 准教授 (70749077)
|
研究分担者 |
河合 洋介 国立研究開発法人国立国際医療研究センター, その他部局等, 副プロジェクト長 (30435515)
片山 俊明 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任教授 (60396869)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2025年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2024年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2023年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | ゲノム構造多型 / ゲノム医療 |
研究開始時の研究の概要 |
ゲノムの大きな変化である構造多型(Structural Variant; SV)が、疾患の発症に関わることが知られており、国内外の大規模コホートによるSVデータの蓄積が進められている。SVデータの解釈には、ゲノム座標や類似性に基づき、既知のSVであるか否かを整理する必要がある。しかし、SV特有の複雑な多様性によりSV間の比較は容易ではなく、煩雑なマニュアル作業が求められている。そこで本研究では、多様なSVデータの効率的なアノテーションとデータ利活用を可能にするため、SVデータの同一判定モデルと類似検索ツールを開発する。
|
研究実績の概要 |
ゲノムの大きな変化である構造多型(Structural Variant; SV)が、疾患の発症に関わることが知られており、国内外の大規模コホートによるSVデータの蓄積が進められている。各研究者が検出したSVデータの解釈には、ゲノム座標や類似性に基づき、既知のSVであるか否かを整理する必要がある。しかし、SV特有の複雑な多様性によりSV間の比較は容易ではなく、既報データに一致するSVがあるかどうかについては、煩雑なマニュアル作業が求められている。そこで本研究では、多様なSVデータの効率的なアノテーションを可能にするため、SVデータの同一判定モデルと類似検索ツールを開発する。具体的には、SV検出アルゴリズム毎に異なる検出領域定義の揺らぎや表記の違いを吸収するための正規化手法を策定し、SV多様性を考慮した同一判断モデルと類似スコアを開発する。更に、SVデータをクエリとし、類似SVデータの検索を可能にするツールの開発を行う。2023年度は、SV検出結果の正規化手法の開発に取り組んだ。先行研究で精度評価が報告されている69のSV検出ツールから、精度およびコミュニティでの使用頻度が高い6ツールを選出し、GIAB(Genome in a Bottle)から取得した全ゲノムシークエンスデータ(Illumina ショートリードおよび PacBio ロングリード)に対してSV検出を実施し、検出結果の比較及び詳細検討を実施した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2023年度はSV検出結果の正規化手法の開発を予定していたが、評価セットの選定および検出結果の詳細検討に時間を要したため、正規化手法検討を完了することができなかった。ただし、2024年度実施予定の類似スコア策定と並行して検討可能であるため、課題遂行において問題はないと考えている。
|
今後の研究の推進方策 |
2024年度は、SV結果の正規化手法および類似性評価のためのスコア開発に取り組む。具体的には、2023年度実施したSV検出結果を元に検出手法間でのずれを評価し、多型タイプごとに正規化を行う。さらに、正規化された検出結果に対し、SVのAlteration配列(変化後の変異配列)間のアライメントスコアとオーバラップに両端のずれを考慮した類似性スコアを策定する。
|