• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実施状況報告書

次世代シークエンシングデータを利用した機械学習によるRNA二次構造予測の高精度化

研究課題

研究課題/領域番号 16K00404
研究機関慶應義塾大学

研究代表者

佐藤 健吾  慶應義塾大学, 理工学部(矢上), 講師 (20365472)

研究期間 (年度) 2016-04-01 – 2019-03-31
キーワードRNA二次構造予測 / NGSデータ / 機械学習
研究実績の概要

RNA二次構造予測は古くから研究されているにも関わらず,長鎖非コードRNAやRNAウィルスのような長いRNA配列に対する予測精度は未だに十分とは言えない.近年,次世代シークエンサーから二次構造プロファイルを取得することが可能となったが,二次構造プロファイルは完全な二次構造でないために,既存の機械学習に基づく手法をそのまま適用することはできない.本研究では,部分的な構造情報である二次構造プロファイルを弱レベル学習データとして利用可能とする機械学習アルゴリズムを開発し,既存手法よりも精密な二次構造モデルを大量の二次構造プロファイルから学習することによって,過学習を回避しつつRNA二次構造予測の精度向上を目指す.これにより,二次構造予測をベースにした機能性RNAの機能・構造解析の精度向上を実現する.本年度は,構造化SVMを元にした弱ラベルデータからの学習アルゴリズムの定式化を行い,次世代シークエンスデータを弱ラベル学習データとするRNA二次造予測モデルのプロトタイプ実装を行なった.計算機実験の結果,次世代シークエンスデータを加えることによるRNA二次構造予測の精度向上が確認された.また,遺伝アルゴリズムによる多目的最適化手法を用いることによって,RNA-RNA相互作用を引き起こす複合二次構造を形成する二本のRNA配列をデザインする手法の開発を行った.計算機実験の結果,本手法のプロトタイプ実装が設計通りに動作し,適切な複合二次構造を形成する配列をデザインしていることが確認された.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

当初の計画通り,弱ラベルデータからの学習アルゴリズムの定式化,およびそのRNA二次構造予測への適用を行うことができたので,おおむね順調に進展していると言える.

今後の研究の推進方策

大量の次世代シークエンスデータからの学習を実現するために,二次構造予測アルゴリズムの最適化および学習の並列化を実装する.

次年度使用額が生じた理由

論文投稿料および旅費が当初の予定よりも少なく済んだことによる.

次年度使用額の使用計画

次年度以降,研究成果を学会発表するための旅費および論文投稿料を当初の予定よりも当初の予定よりも増やす.

  • 研究成果

    (2件)

すべて 2016

すべて 学会発表 (2件)

  • [学会発表] Improving RNA secondary structure prediction with weak label learning from NGS data2016

    • 著者名/発表者名
      Akiyama, M., Sakakibara, Y., Sato, K.
    • 学会等名
      第5回生命医薬情報学連合大会,日本バイオインフォ マティクス学会2016年年会
    • 発表場所
      東京国際交流館プラザ平成(東京都・江東区)
    • 年月日
      2016-09-29 – 2016-10-01
  • [学会発表] Inverse folding of two interacting RNA molecules2016

    • 著者名/発表者名
      Taneda, A., Sato, K.
    • 学会等名
      第5回生命医薬情報学連合大会,日本バイオインフォ マティクス学会2016年年会
    • 発表場所
      東京国際交流館プラザ平成(東京都・江東区)
    • 年月日
      2016-09-29 – 2016-10-01

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi