分子内相互作用を考慮したRNA二次構造予測のためのパラメータ決定法
Project/Area Number |
18J21767
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Single-year Grants |
Section | 国内 |
Research Field |
Life / Health / Medical informatics
|
Research Institution | Keio University |
Principal Investigator |
秋山 真那斗 慶應義塾大学, 理工学研究科, 特別研究員(DC1)
|
Project Period (FY) |
2018-04-25 – 2021-03-31
|
Project Status |
Completed (Fiscal Year 2020)
|
Budget Amount *help |
¥2,200,000 (Direct Cost: ¥2,200,000)
Fiscal Year 2020: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 2019: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 2018: ¥800,000 (Direct Cost: ¥800,000)
|
Keywords | RNA / バイオインフォマティクス / 深層学習 / 非コードRNA / RNA二次構造 |
Outline of Annual Research Achievements |
非コードRNA(ncRNA)は、タンパク質に変換されない小さな非コード配列であり、多くの病気の遺伝子発現の調節に関与している。非コードRNAは、機能に応じていくつかのタイプに分類される。類似した配列と構造を持つncRNAは類似した機能を持つことが期待されるため、ncRNAのクラスター化は機能を知るための最初のステップとして役立つ。 ncRNAの分類のために多くのツールが開発されてきたが、実行時間と分類の正確さにおいて多くの課題がある。多くの分類アルゴリズムではRNA配列の類似性を計算するために配列アラインメントを実行しているため実行時間が長くかかる。更にこれらのアルゴリズムの多くは既存のncRNAクラスのラベルをを用いた 教師あり学習を採用しているため新規RNAクラスの探索を行うことは困難である。 本年度はこれまで作成したRNA二次構造予測アルゴリズムを基盤として、自然言語処理の分野で広く運用されているBERT事前トレーニングに基づく新しいncRNAs分類アルゴリ ズムであるBERTCLUSTを開発した。BERT事前トレーニングは既存のRNAクラスラベルを使用しない、教師なし学習を採用している。大量のncRNA配列を用いて教師なし学習を実行することにより、既存の方法よりもncRNAクラスの分類精度が向上した。更に、BERT内のattentionメカニズムを用いることでncRNAクラスの分類について重要な部分配列を可視化することに成功した。BERTによる塩基の埋め込みは、word2vecなどの既存の埋め込み手法に比べて、優れたクラスタリング精度を達成した。
|
Research Progress Status |
令和2年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和2年度が最終年度であるため、記入しない。
|
Report
(3 results)
Research Products
(5 results)