2020 Fiscal Year Research-status Report
Elucidation of splicing-code with RNA-specialized machine learning system toward overcoming hereditary diseases having splicing misregulations
Project/Area Number |
20K07310
|
Research Institution | Kyoto University |
Principal Investigator |
飯田 慶 京都大学, 医学研究科, 特定助教 (00387961)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | RNAスプライシング / 遺伝性疾患 / バイオインフォマティクス / 機械学習 / ケミカルバイオロジー |
Outline of Annual Research Achievements |
本研究ではRNAスプライシングに着目し、①RNAの制御様式に即した機械学習モデルを構築することで、塩基変異がスプライシングおよび遺伝子機能に与える影響を評価する手法を構築し、②機械学習モデルの可視化技術の応用等を通じスプライシングコードの解明を目指すものである。この目標に対して、RNA塩基配列情報を一様に扱う「一般的なニューラルネットワークモデル」と「RNA制御特化型・ニューラルネットワークモデル」という2種類の機械学習モデルの構築・改良を行うことを計画している。当初の研究計画に基づき、「一般的なニューラルネットワークモデル」として、Illumina社の研究グループが開発したSpliceAIを導入すること選択した。これは~1万塩基の配列情報を最大32層の畳み込み層で学習するもので、スプライスサイトの予測において高い精度を示すことが報告されている。SpliceAIは構成的エキソンの検出が可能な学習済みモデルが公開されているが、本研究では組織特異的なスプライシングや化合物応答性のスプライシング制御を解明することを目指し、SpliceAIを任意の遺伝子セットで再学習するための解析系の立ち上げを行った。また、「RNA制御特化型・ニューラルネットワークモデル」の構築を目指し、入力情報の候補となりうる塩基配列・特徴量の整備を進めた。事前解析で用いていた約500個の特徴量に加え、論文やデータベースがから1000個以上の特徴量候補を収集し、これらを「RNA制御特化型・ニューラルネットワークモデル」の入力情報として扱える段階まで研究を進めた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究を構成する2つの技術的要素である、「一般的なニューラルネットワークモデル」と、「RNA制御特化型・ニューラルネットワークモデル」についてそれぞれ導入・開発を進めることができ、概ね予定通りの進捗が得られている。
|
Strategy for Future Research Activity |
当初の研究計画に従い、スプライシング暗号の解明に必要不可欠な要素である、機械学習モデルの可視化技術の導入・開発を最優先にして本年度の研究を進める。手法として変分オートエンコーダの応用や入力塩基配列のバリエーションを用いた表現などを検討しており、これらについて順次、検討・開発を進めていく。また、令和2年度に進捗の得られた2つのアプローチによる機械学習モデルの構築についても研究・開発を継続し、それぞれの精度や特徴を精査したうえで、スプライシング暗号の解明を目指した改良を加えていく。
|
Causes of Carryover |
・解析ワークステーション用のストレージの増強を計画していたが、令和2年度の研究計画を遂行するにあたり、ストレージが充足していることが分かったため、この増強計画を令和3年度以降に移動させた。
・コロナ禍の影響のため参加予定だった学会が中止となり、旅費の支出がなくなった。
|
Research Products
(2 results)