研究課題/領域番号 |
22H03689
|
配分区分 | 補助金 |
研究機関 | 東京電機大学 |
研究代表者 |
佐藤 健吾 東京電機大学, システム デザイン 工学部, 教授 (20365472)
|
研究分担者 |
加藤 有己 大阪大学, 大学院医学系研究科, 准教授 (10511280)
河原 行郎 大阪大学, 大学院医学系研究科, 教授 (80542563)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
キーワード | RNA二次構造 / RNA修飾 / バイオインフォマティクス / 深層学習 |
研究実績の概要 |
本研究課題ではRNA修飾を考慮した二次構造予測を実現する高度なアルゴリズムを開発する.本研究がベースにするMXfold2は,深層ニューラルネットワークによる熱力学パラメータの精緻化によって高精度化を図る一方,深層ニューラルネットワークが計算するスコアと既存の熱力学パラメータを統合することによって過学習の影響を最小限に抑えて未知RNA配列に対する頑健性を向上させることに成功し,その結果RNA二次構造予測において世界最高精度を達成した.MXfold2は入力として4種類の正規な塩基 (A, C, G, U) にのみ対応しており,本研究ではこれをm6A,シュードウリジン,イノシンなどの修飾塩基に拡張する.具体的には,それぞれ4種類の塩基を表す4ビットのone-hot表現による入力から,修飾塩基の化学構造式を表すN (=1024) ビットのフィンガープリント表現による入力に変更する.フィンガープリント表現のそれぞれのビットは特定の部分構造の有無を表している.これによって塩基同士の化学的な類似度をモデルに埋め込むことが可能となり,訓練データで出現頻度が低い修飾塩基については,類似した塩基の特徴量からの類推を期待できる.これまでに本手法のプロトタイプ実装を行なった.さらに,完全な二次構造ではなく,ケミカルプロービングにより得られる二次構造プロファイルから二次構造予測モデルのパラメータを学習する手法を開発し,シミュレーションデータにおいてその検証を行なった結果,十分な精度を得られることを確認した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の予定通り,修飾塩基を考慮したRNA二次構造予測アルゴリズムの開発を進めることができたため,概ね順調に進展していると言える.
|
今後の研究の推進方策 |
ケミカルプロービングにより得られる二次構造プロファイルから二次構造予測モデルのパラメータを学習する手法は,今のところシミュレーションデータにおいてのみ検証が行われた.今後は実在の二次構造プロファイルデータでの検証を行い,さらに修飾塩基を含むデータにおける有効性を確認する.
|