• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

混合正則化モデリングを軸としたヘテロ生物データ群からの機械学習の研究

Research Project

Project/Area Number 17K00407
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Research Field Life / Health / Medical informatics
Research InstitutionKyushu University

Principal Investigator

丸山 修  九州大学, 芸術工学研究院, 准教授 (20282519)

Project Period (FY) 2017-04-01 – 2021-03-31
Project Status Granted (Fiscal Year 2019)
Budget Amount *help
¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2019: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2018: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
Fiscal Year 2017: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Keywordsモチーフ / 崩壊型ギブス・サンプリング / 結合部位 / 依存関係モデル / E3ユビキチン・ライゲース / たんぱく質disorder / 混合正則化 / バイオインフォマティクス / モデリング / E3ユビキチン・ライゲース / タンパク質disorder / 機械学習 / マルコフ連鎖モンテカルロ法 / タンパク質複合体 / タンパク質間相互作用ネットワーク / ボルツマン分布 / ヘテロ生物データ
Outline of Annual Research Achievements

正則化モデリングとは,べき乗則や L1 ノルムなどの正則化項を評価関数に加えて自然な解を同定する技法であり,混合正則化モデリングとは正則化項を複数組み合わせるモデリングである.本研究の目的は,ヘテロな生物データ群からの予測問題に対して,(1) 混合正則化モデリングを軸とした評価関数の設計技法の深化と,(2) (1) の評価関数のための最適化アルゴリズムの構築を行う.以上を通して,大量に蓄積されつつある生物データ群からの予測問題のための機械学習アプローチの方法論的基盤を確立することである.
当研究課題は,この3年間,配列モチーフ発見ツールである「E3ユビキチン・ライゲース結合部位予測のための崩壊型ギブス・サンプリング・アルゴリズムDegSampler」の開発を集中的に行ってきた.確率配列モチーフのでファクタスタンダードは位置依存スコア行列(PSSM; position-specific scoring atrix)である.これは各位置に独立なカテゴリカル分布が対応することにより構成されるモデルである.このモデルの欠点は,モチーフの位置間の独立性である.
そこで本年度は,予測精度向上のアプローチとして,位置依存スコア行列(PSSM; position-specific scoring atrix)の相異なる位置に出現する文字間の依存関係を許す配列モチーフモデルを定式化し,これを最適化するアルゴリズムを開発した.
そして次の結果を得ている:(1)調査対象として選んだ36種類のE3特異的基質タンパク質配列集合に対するE3ユビキチン・ライゲースの結合部位の予測精度は,DegSampler version 3とその前のversionとほぼ同程度であった.(2)しかしながら,36種類の結果を個別に見ていくと,予測精度が大きく違っている場合が36個中9個存在した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本課題では,E3ユビキチン・リガーゼが結合する基質の部位と配列モチーフを同時に推定する崩壊型ギブス・サンプリング・アルゴリズム DegSamplerのシリーズを開発してきている.このツールは次の特徴を有している:
(1) アミノ酸の化学特性に基づく尤度関数を有している.
(2) モチーフ出現位置の事前分布として,与えられたタンパク質配列の各位置がdisorder領域に含まれる可能性やdisorder領域におけるE3結合可能性などの様々な事前情報を活用することが可能である.
(3) 崩壊型のギブス・サンプリングであるため計算の効率が高く結果のブレが相対的に少ない.
本年度は,このような特徴をもつDegSamplerに対して,これまでの配列モチーフ・モデルである位置依存スコア行列(PSSM)を「モチーフ内の位置のペアワイズ依存関係を許したより複雑なモチーフ・モデル」を具体化した尤度関数に改善するとともに,対応する文字ペア上のディリクレ事前分布を構成し,これをDegSampler version 3として発表した.36種類のE3特異的基質タンパク質配列集合に対するE3ユビキチン・ライゲースの結合部位の予測精度は平均的には前バージョンと同程度であったが,予測精度が大きく違っている場合が36個中9個存在することが分かった.これはモチーフ・モデルごとに特異不得意があることと示唆するという興味深い結果である.

Strategy for Future Research Activity

さらにE3結合部位のギブス・サンプラーの改良を続行するとともに,当初の予定通り,ベイズ推定の技法を駆使し,ヘテロな大量生物学的データからの予測手法の開発を行う.この際に,評価関数の設計において,混合正則化を含む様々なモデリングを考察する.

Report

(3 results)
  • 2019 Research-status Report
  • 2018 Research-status Report
  • 2017 Research-status Report

Research Products

(9 results)

All 2019 2018 2017

All Journal Article Presentation

  • [Journal Article] DegSampler3: Pairwise Dependency Model in Degradation Motif Site Prediction of Substrate Protein Sequences2019

    • Author(s)
      Maruyama Osamu、Matsuzaki Fumiko
    • Journal Title

      Proceedings - 2019 IEEE 19th International Conference on Bioinformatics and Bioengineering, BIBE 2019

      Volume: NA Pages: 11-17

    • DOI

      10.1109/bibe.2019.00012

    • Related Report
      2019 Research-status Report
    • Peer Reviewed
  • [Journal Article] Determining the Minimum Number of Protein-Protein Interactions Required to Support Known Protein Complexes2018

    • Author(s)
      Natsu Nakajima, Morihiro Hayashida, Jesper Jansson, Osamu Maruyama, Tatsuya Akutsu
    • Journal Title

      PLoS ONE

      Volume: 13

    • DOI

      10.1371/journal.pone.0195545

    • Related Report
      2018 Research-status Report
    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] [Regular Paper] DegSampler: Collapsed Gibbs Sampler for Detecting E3 Binding Sites2018

    • Author(s)
      Maruyama Osamu、Matsuzaki Fumiko
    • Journal Title

      Proc. of 2018 IEEE 18th International Conference on Bioinformatics and Bioengineering (BIBE)

      Volume: 1 Pages: 1-9

    • DOI

      10.1109/bibe.2018.00009

    • Related Report
      2018 Research-status Report
    • Peer Reviewed
  • [Journal Article] Two Challenging Difficulties of Protein Complex Prediction2018

    • Author(s)
      Maruyama Osamu
    • Journal Title

      Agriculture as a Metaphor for Creativity in All Human Endeavors. FMfI 2016. Mathematics for Industry

      Volume: 28 Pages: 139-145

    • DOI

      10.1007/978-981-10-7811-8_14

    • Related Report
      2017 Research-status Report
    • Peer Reviewed
  • [Journal Article] RocSampler: regularizing overlapping protein complexes in protein-protein interaction networks2017

    • Author(s)
      Maruyama Osamu、Kuwahara Yuki
    • Journal Title

      BMC Bioinformatics

      Volume: 18 Pages: 491-491

    • DOI

      10.1186/s12859-017-1920-5

    • Related Report
      2017 Research-status Report
    • Peer Reviewed / Open Access
  • [Presentation] DegSampler3: Pairwise dependency model in degradation motif site prediction of substrate protein sequences2019

    • Author(s)
      Osamu Maruyama
    • Organizer
      2019 IEEE 19th International Conference on Bioinformatics and Bioengineering, BIBE 2019
    • Related Report
      2019 Research-status Report
    • Int'l Joint Research
  • [Presentation] E3結合部位予測のための崩壊型ギブス・サンプラーDegSampler2019

    • Author(s)
      丸山 修
    • Organizer
      分子生物情報研究会 (SIG-MBI)
    • Related Report
      2018 Research-status Report
  • [Presentation] 正負例配列集合のためのコンセンサス・モチーフによるクラスタリング・アルゴリズム2017

    • Author(s)
      丸山 修
    • Organizer
      日本バイオインフォマティクス学会(JSBi)九州地域部会セミナー宮崎開催
    • Related Report
      2017 Research-status Report
  • [Presentation] Regularizing protein complexes by mutually exclusive protein-protein interactions2017

    • Author(s)
      丸山 修
    • Organizer
      第6回生命医薬情報学連合大会(IIBMP 2017)
    • Related Report
      2017 Research-status Report

URL: 

Published: 2017-04-28   Modified: 2021-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi