研究課題/領域番号 |
22J23899
|
配分区分 | 補助金 |
研究機関 | 京都大学 |
特別研究員 |
黒澤 凌 京都大学, 医学研究科, 特別研究員(DC1)
|
研究期間 (年度) |
2022-04-22 – 2025-03-31
|
キーワード | RNAスプライシング / 機械学習 / 深層学習 / バイオインフォマティクス / ゲノム |
研究実績の概要 |
遺伝子変異の一部はRNAスプライシングに異常をきたし、遺伝性疾患の発生要因やリスク因子となっている。発病におけるスプライシング異常の寄与を正確に評価すべく、DNAの塩基配列からスプライシング異常を予測する技術の開発が進められてきた。しかし、大半の従来手法はDNAの配列パターンのみがモデリングの対象となっており、組織種・細胞種によって本来異なっているスプライシング制御環境の差は考慮されてこなかった。本研究では、組織種・細胞種特異的なスプライシングパターンのモデリング手法を確立することで、スプライシングコードの完全解明に資することを目的としている。本年度は、既報の深層学習モデルの再現と教師データの作成方法の検討を進めた。各モデルにおいて、原著論文中で記載されているのと同程度の予測精度を持つモデルの再現に成功した。本研究目的の細胞種特異的なスプライシング予測プログラムを作成する上では、これらのモデルを基に構造の調整と最適化を進める予定である。次に教師データの作成方法の検討について、それぞれの細胞種に特異的なスプライシングイベントをRNAシーケンスデータから検出することを試みた。また、以上と並行して、予測されたスプライシング変動のイベントの病原性を予測するシステムの構築も進めた。細胞種特異的なスプライシング予測が可能になり、遺伝子バリアントによるスプライシング異常の検出が効率化しても、そのすべてが病的な影響をもたらすわけでないためである。そこで、スプライシング予測結果からさらに病原性まで判定するシステムを組み込んだPDIVASという予測モデルを開発した。PDIVASの開発に際して得られた知見は細胞種特異的なスプライシング予測プログラムを病原性予測プログラムに昇華するのに生かすことができると考えている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
教師データの作成から学習モデルの構築まで順調に進んでおり、深層学習の実行系を整備することが出来た。学習精度の最適化を図る上で重要な、教師データのフォーマットとモデル構造の可変性も与えることに成功した。一方、より長期的な臨床利用の目線で重要となる、病原性予測にもいち早く取り組むことが出来た。
|
今後の研究の推進方策 |
今回構築できた、深層学習系をフルに活用して、細胞種特異的な予測プログラムの最適化を実施する。また、病原性予測プログラムPDIVASを完成させ、臨床現場で取得された遺伝病患者ゲノムの解析に適応し、新規の遺伝子診断に導くことが出来るかどうかを検証する。
|