研究課題/領域番号 |
18K11543
|
研究機関 | 国立研究開発法人産業技術総合研究所 |
研究代表者 |
今井 賢一郎 国立研究開発法人産業技術総合研究所, 生命工学領域, 主任研究員 (80442573)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | アイソフォーム / 細胞内局在部位変化 / ターゲッティングシグナル予測 / 選択的スプライシング / 選択的翻訳開始点 |
研究実績の概要 |
本研究は、選択的スプライシング(AS)や選択的翻訳開始点(ATI)によって、アイソフォームレベルでの細胞内局在部位の変化により機能調節を行う遺伝子の新規発見及び、その機能の解明を目指すことを目的としている。これまで、ASやATIによって局在部位の変化を起こすアイソフォームを生じ、相互作用の相手などを変化させることで、細胞機能の調節に関わっていることが報告されている遺伝子のほとんどは、ミトコンドリアターゲティングシグナル(MTS)の獲得/欠損を起こすものである。したがって、MTS予測法の予測精度向上は、アイソフォームレベルで局在変化を起こす遺伝子の網羅的探索を行うために重要な課題である。我々は、これまで、サポートベクタマシーンを用いた機械学習により構築した高精度のMTS予測法(MitoFates, Fukasawa et al., MCP, 2015)を開発しているが、本年度は、さらなる改良を目指し、深層学習を用いた予測方法の検討を行った。MitoFatesと同じ学習セットを用い、ネットワークアーキテクチャ,各層のユニットサイズおよび打ち切りエポック数等に至る様々なハイパーパラメータの最適化を行った結果、第1層に入力層,第2層および3層に双方向長短期記憶(LSTM)を持ち,第4層に全結合層,第5層に出力層を持つネットワークを採用し、予測法を構築した。また、独立したテストデータを用意し、MitoFatesとMatthews correlation coefficient (MCC)とROC AUCによる性能比較を行ったところ、MitoFatesがMCC: 0.446, AUC: 0.954に対し、今回の手法は、MCC: 0.496, AUC: 0.942であり、MCCでは、MitoFatesを上回る予測性能を得ることができた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究初年度は、アイソフォームレベルで細胞内局在部位の変化を起こす遺伝子候補の網羅的探索に重要な技術開発として、MTS予測の性能向上を主な研究目標として研究を進めた。改良方法として、深層学習を用いた予測方法の検討を行った結果、上記の通り、MCCでは、これまでの予測方法を上回る予測性能を得ることができた。大きな予測精度の向上とまではいかなかったが、サポートベクタマシーンによる予測法と深層学習による予測法の併用により、網羅的なアイソフォームレベルで局在変化を起こす遺伝子候補の探索に厚みを出せる可能性があるので、研究は、概ね順調に進んでいると考えられる。
|
今後の研究の推進方策 |
サポートベクタマシーン及び深層学習によるMTS予測には、まだ改善の余地はあるが、学習データ数の増加や新しい特徴量の追加などが必要である。そこで、近年得られたヒトとマウスのミトコンドリアタンパク質のN末端プロテオーム(N-プロテオーム)情報(Jacome et al., Proteomics, 2015, Calvo et al., MCP, 2017 )の解析を行い、新規のMTS情報の抽出と新たな特徴量抽出について検討したい。また、MTSを持つミトコンドリアタンパク質の半数以上は、バクテリアと共通祖先をもつので、バクテリアホモログとのN末端比較も新しい特徴量として期待できる。学習データの増加と新たな特徴量の追加によりMTS予測の性能向上が得られたら、分泌経路へのターゲティングシグナルであるシグナルペプチド予測、膜貫通セグメント予測と組み合わせ、アイソフォームレベルで細胞内局在部位の変化を起こす遺伝子候補の探索パイプラインの開発を行っていく予定である。
|