2022 Fiscal Year Annual Research Report
ゲノム情報からスプライシング異常を細胞種別に予測する深層学習モデルの構築
Project/Area Number |
22J23899
|
Allocation Type | Single-year Grants |
Research Institution | Kyoto University |
Research Fellow |
黒澤 凌 京都大学, 医学研究科, 特別研究員(DC1)
|
Project Period (FY) |
2022-04-22 – 2025-03-31
|
Keywords | RNAスプライシング / 機械学習 / 深層学習 / バイオインフォマティクス / ゲノム |
Outline of Annual Research Achievements |
遺伝子変異の一部はRNAスプライシングに異常をきたし、遺伝性疾患の発生要因やリスク因子となっている。発病におけるスプライシング異常の寄与を正確に評価すべく、DNAの塩基配列からスプライシング異常を予測する技術の開発が進められてきた。しかし、大半の従来手法はDNAの配列パターンのみがモデリングの対象となっており、組織種・細胞種によって本来異なっているスプライシング制御環境の差は考慮されてこなかった。本研究では、組織種・細胞種特異的なスプライシングパターンのモデリング手法を確立することで、スプライシングコードの完全解明に資することを目的としている。本年度は、既報の深層学習モデルの再現と教師データの作成方法の検討を進めた。各モデルにおいて、原著論文中で記載されているのと同程度の予測精度を持つモデルの再現に成功した。本研究目的の細胞種特異的なスプライシング予測プログラムを作成する上では、これらのモデルを基に構造の調整と最適化を進める予定である。次に教師データの作成方法の検討について、それぞれの細胞種に特異的なスプライシングイベントをRNAシーケンスデータから検出することを試みた。また、以上と並行して、予測されたスプライシング変動のイベントの病原性を予測するシステムの構築も進めた。細胞種特異的なスプライシング予測が可能になり、遺伝子バリアントによるスプライシング異常の検出が効率化しても、そのすべてが病的な影響をもたらすわけでないためである。そこで、スプライシング予測結果からさらに病原性まで判定するシステムを組み込んだPDIVASという予測モデルを開発した。PDIVASの開発に際して得られた知見は細胞種特異的なスプライシング予測プログラムを病原性予測プログラムに昇華するのに生かすことができると考えている。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
教師データの作成から学習モデルの構築まで順調に進んでおり、深層学習の実行系を整備することが出来た。学習精度の最適化を図る上で重要な、教師データのフォーマットとモデル構造の可変性も与えることに成功した。一方、より長期的な臨床利用の目線で重要となる、病原性予測にもいち早く取り組むことが出来た。
|
Strategy for Future Research Activity |
今回構築できた、深層学習系をフルに活用して、細胞種特異的な予測プログラムの最適化を実施する。また、病原性予測プログラムPDIVASを完成させ、臨床現場で取得された遺伝病患者ゲノムの解析に適応し、新規の遺伝子診断に導くことが出来るかどうかを検証する。
|