• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Research-status Report

次世代シークエンシングデータを利用した機械学習によるRNA二次構造予測の高精度化

Research Project

Project/Area Number 16K00404
Research InstitutionKeio University

Principal Investigator

佐藤 健吾  慶應義塾大学, 理工学部(矢上), 講師 (20365472)

Project Period (FY) 2016-04-01 – 2020-03-31
Keywordsバイオインフォマティクス / RNA二次構造予測 / 機械学習
Outline of Annual Research Achievements

RNA二次構造予測は古くから研究されているにも関わらず,長鎖非コードRNAやRNAウィルスのような長いRNA配列に対する予測精度は未だに十分とは言えない.近年,次世代シークエンサーから二次構造プロファイルを取得することが可能となったが,二次構造プロファイルは完全な二次構造でないために,既存の機械学習に基づく手法をそのまま適用することはできない.本研究では,部分的な構造情報である二次構造プロファイルを弱レベル学習データとして利用可能とする機械学習アルゴリズムを開発し,既存手法よりも精密な二次構造モデルを大量の二次構造プロファイルから学習することによって,過学習を回避しつつRNA二次構造予測の精度向上を目指す. これにより,二次構造予測をベースにした機能性RNAの機能・構造解析の精度向上を実現する.RNA二次構造予測アルゴリズムmxfoldを開発した.本手法では,これまでRNA二次構造予測で用いられてきた自由エネルギー最小化に基づく手法と機械学習に基づく手法を組み合わせ,意味のある特徴量を選択するL1正則化を機械学習に組み込むことによって適切な複雑さを表現することができる二次構造予測モデルを学習する.ベンチマーク実験では,従来の手法と比べて極めて高い精度でRNA二次構造を予測可能であることを示した.さらに,構造化SVMと深層学習を組み合わせた機械学習アルゴリズムを用いて塩基対確率を直接推定し,その上で期待精度最大化に基づくRNA二次構造予測を行う手法の改良を行った.これによって,通常のRNA二次構造予測のみならず,シュードノット構造を考慮したRNA二次構造予測において既存手法を上回る精度を期待できる.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

当初の計画通り,過学習を回避する方法および深層学習を含む高度な機械学習アルゴリズムを導入することに成功したため,おおむね順調に進展していると言える.

Strategy for Future Research Activity

本年度開発した手法(熱力学モデルの融合および深層学習の導入)を,大量の次世代シークエンスデータから得られる弱ラベルからの機械学習アルゴリズムに適用し,さらに高精度なRNA二次構造予測を目指す.

Causes of Carryover

(理由)
物品費,論文投稿料が当初の予定よりも少なく済んだことによる.
(使用計画)
次年度以降,研究成果を学会発表するための旅費および論文投稿料を当初の予定よりも当初の予定よりも増やす.

  • Research Products

    (6 results)

All 2018 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results,  Open Access: 2 results) Presentation (2 results) (of which Invited: 1 results) Remarks (1 results)

  • [Journal Article] A max-margin training of RNA secondary structure prediction integrated with the thermodynamic model2018

    • Author(s)
      Akiyama Manato、Sato Kengo、Sakakibara Yasubumi
    • Journal Title

      Journal of Bioinformatics and Computational Biology

      Volume: 16 Pages: 1840025~1840025

    • DOI

      10.1142/S0219720018400255

    • Peer Reviewed
  • [Journal Article] Convolutional neural network based on SMILES representation of compounds for detecting chemical motif2018

    • Author(s)
      Hirohara Maya、Saito Yutaka、Koda Yuki、Sato Kengo、Sakakibara Yasubumi
    • Journal Title

      BMC Bioinformatics

      Volume: 19 Pages: 526

    • DOI

      10.1186/s12859-018-2523-5

    • Peer Reviewed / Open Access
  • [Journal Article] Extension of Question-Answering Program to Automatically Answering the Medical Licensing Examination to Drug Related Questions2018

    • Author(s)
      Mizuguchi Tatsuya、Ito Shino、Sato Kengo、Sakakibara Yasubumi
    • Journal Title

      Transactions of the Japanese Society for Artificial Intelligence

      Volume: 33 Pages: E~I58_1-10

    • DOI

      10.1527/tjsai.e-i58

    • Peer Reviewed / Open Access
  • [Presentation] 機械学習を用いたRNA二次構造予測2018

    • Author(s)
      佐藤健吾
    • Organizer
      日本バイオインフォマティクス学会九州地域部会セミナー
    • Invited
  • [Presentation] 深層学習に基づくRNAグアニン4重鎖構造識別法の検討2018

    • Author(s)
      加藤有己,佐藤健吾,Jakob Hull Havgaard,河原行郎
    • Organizer
      第20回日本RNA学会年会
  • [Remarks] MXfold: the max-margin based RNA folding algorithm

    • URL

      https://github.com/keio-bioinformatics/mxfold

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi