• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Research-status Report

文字列解析のための統計理論とその計算生化学への応用

Research Project

Project/Area Number 26610037
Research InstitutionKyoto University

Principal Investigator

小谷野 仁  京都大学, 医学(系)研究科(研究院), 助教 (10570989)

Co-Investigator(Kenkyū-buntansha) 林田 守広  京都大学, 化学研究所, 助教 (40402929)
Project Period (FY) 2014-04-01 – 2017-03-31
Keywords文字列 / 確率論 / 統計学 / 機械学習 / 生物配列 / バイオインフォマティクス
Outline of Annual Research Achievements

昨年度は、2014 年度に得た文字列の非可換位相半群 A* 上の確率論における結果とそれに基づいて構築した文字列データを教師付きの仕方で識別する学習機械の理論を応用して、塩基配列を用いた RNA の 2 次構造の予測及びアミノ酸配列を用いたタンパク質間相互作用の予測の研究を行った。また、A* 上で混合モデルと EM アルゴリズムの理論を展開することにより、文字列データを教師なしの仕方で分類する統計理論を構築した。これらの研究の結果を次の 3 本の論文にまとめた (3 本目は査読中)。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

本研究プロジェクトは、[1] 文字列の非可換位相半群 A* 上で確率論を整備する、[2] [1] の結果に基づいて、文字列データを教師付きの仕方で識別する学習機械の理論を構築する、[3] [1] の結果に基づいて文字列データを教師なしの仕方で分類する統計理論を構築する、[4] [2] の方法を応用して、アミノ酸配列を用いたタンパク質間相互作用の予測と塩基配列を用いた RNA の 2 次構造の予測の研究を行う、[5] [3] の方法を応用して、16S リボソーム RNA 遺伝子配列を用いた gamma 多様性の測定の研究を行う、という 5 つの部分からなっているが、2014 年度と昨年度までで [1] から [4] までが終わっているため。

Strategy for Future Research Activity

本研究プロジェクトの最終年度である本年度は、上の【現在までの進捗状況】において述べた本プロジェクトの最後の部分である [5] の研究を行う。現在、林田が京都大学化学研究所の KEGG データベースのデータの前処理を行っており、小谷野のデータ解析のためのプログラムを作成している。また、最後に 3 年間の研究の総括を行う。

Causes of Carryover

昨年度投稿した論文の出版費用として計上していたが、現在査読中であり、出版に至らなかったため。

Expenditure Plan for Carryover Budget

今年度、論文の出版費として使用する予定である。

  • Research Products

    (6 results)

All 2016 2015

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Acknowledgement Compliant: 1 results) Presentation (4 results) (of which Int'l Joint Research: 2 results)

  • [Journal Article] Maximum margin classifier working in a set of strings2016

    • Author(s)
      Koyano, H., Hayashida, M., and Akutsu, T.
    • Journal Title

      Proceedings of the Royal Society A

      Volume: 472 Pages: 印刷中

    • DOI

      10.1098/rspa.2015.0551

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] Integer linear programming approach to center and median strings for a probability distribution on a set of strings2016

    • Author(s)
      Koyano, H. and Hayashida, M
    • Journal Title

      Communications in Computer and Information Science

      Volume: 未定 Pages: 未定

    • Peer Reviewed
  • [Presentation] Optimal string clustering based on a Laplace-like mixture and EM algorithm on a topological monois of strings2016

    • Author(s)
      小谷野仁
    • Organizer
      1st IMA Conference on Theoretical and Computational Discrete Mathematics
    • Place of Presentation
      Derby, UK
    • Year and Date
      2016-03-22 – 2016-03-23
    • Int'l Joint Research
  • [Presentation] Integer linear programming approach to center and median strings for a probability distribution on a set of strings2016

    • Author(s)
      林田守広
    • Organizer
      7th International Conference on Bioinformatics Models, Methods, and Algorithms
    • Place of Presentation
      Rome, Italy
    • Year and Date
      2016-02-21 – 2016-02-23
    • Int'l Joint Research
  • [Presentation] 文字列データの統計的クラスタリングのための Laplace 様混合モデルと EM アルゴリズムの理論2015

    • Author(s)
      小谷野仁
    • Organizer
      日本応用数理学会
    • Place of Presentation
      金沢大学
    • Year and Date
      2015-09-09 – 2015-09-11
  • [Presentation] 文字列の集合上の Laplace 様混合モデルと EM アルゴリズムに基づく文字列クラスタリグ2015

    • Author(s)
      小谷野仁
    • Organizer
      日本情報処理学会
    • Place of Presentation
      沖縄先端科学技術大学院大学
    • Year and Date
      2015-06-23 – 2015-06-25

URL: 

Published: 2017-01-06  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi