• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実施状況報告書

文字列解析のための統計理論とその計算生化学への応用

研究課題

研究課題/領域番号 26610037
研究機関京都大学

研究代表者

小谷野 仁  京都大学, 医学(系)研究科(研究院), 助教 (10570989)

研究分担者 林田 守広  京都大学, 化学研究所, 助教 (40402929)
研究期間 (年度) 2014-04-01 – 2017-03-31
キーワード文字列 / 確率論 / 統計学 / 機械学習 / 生物配列 / バイオインフォマティクス
研究実績の概要

昨年度は、2014 年度に得た文字列の非可換位相半群 A* 上の確率論における結果とそれに基づいて構築した文字列データを教師付きの仕方で識別する学習機械の理論を応用して、塩基配列を用いた RNA の 2 次構造の予測及びアミノ酸配列を用いたタンパク質間相互作用の予測の研究を行った。また、A* 上で混合モデルと EM アルゴリズムの理論を展開することにより、文字列データを教師なしの仕方で分類する統計理論を構築した。これらの研究の結果を次の 3 本の論文にまとめた (3 本目は査読中)。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

本研究プロジェクトは、[1] 文字列の非可換位相半群 A* 上で確率論を整備する、[2] [1] の結果に基づいて、文字列データを教師付きの仕方で識別する学習機械の理論を構築する、[3] [1] の結果に基づいて文字列データを教師なしの仕方で分類する統計理論を構築する、[4] [2] の方法を応用して、アミノ酸配列を用いたタンパク質間相互作用の予測と塩基配列を用いた RNA の 2 次構造の予測の研究を行う、[5] [3] の方法を応用して、16S リボソーム RNA 遺伝子配列を用いた gamma 多様性の測定の研究を行う、という 5 つの部分からなっているが、2014 年度と昨年度までで [1] から [4] までが終わっているため。

今後の研究の推進方策

本研究プロジェクトの最終年度である本年度は、上の【現在までの進捗状況】において述べた本プロジェクトの最後の部分である [5] の研究を行う。現在、林田が京都大学化学研究所の KEGG データベースのデータの前処理を行っており、小谷野のデータ解析のためのプログラムを作成している。また、最後に 3 年間の研究の総括を行う。

次年度使用額が生じた理由

昨年度投稿した論文の出版費用として計上していたが、現在査読中であり、出版に至らなかったため。

次年度使用額の使用計画

今年度、論文の出版費として使用する予定である。

  • 研究成果

    (6件)

すべて 2016 2015

すべて 雑誌論文 (2件) (うち査読あり 2件、 謝辞記載あり 1件) 学会発表 (4件) (うち国際学会 2件)

  • [雑誌論文] Maximum margin classifier working in a set of strings2016

    • 著者名/発表者名
      Koyano, H., Hayashida, M., and Akutsu, T.
    • 雑誌名

      Proceedings of the Royal Society A

      巻: 472 ページ: 印刷中

    • DOI

      10.1098/rspa.2015.0551

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Integer linear programming approach to center and median strings for a probability distribution on a set of strings2016

    • 著者名/発表者名
      Koyano, H. and Hayashida, M
    • 雑誌名

      Communications in Computer and Information Science

      巻: 未定 ページ: 未定

    • 査読あり
  • [学会発表] Optimal string clustering based on a Laplace-like mixture and EM algorithm on a topological monois of strings2016

    • 著者名/発表者名
      小谷野仁
    • 学会等名
      1st IMA Conference on Theoretical and Computational Discrete Mathematics
    • 発表場所
      Derby, UK
    • 年月日
      2016-03-22 – 2016-03-23
    • 国際学会
  • [学会発表] Integer linear programming approach to center and median strings for a probability distribution on a set of strings2016

    • 著者名/発表者名
      林田守広
    • 学会等名
      7th International Conference on Bioinformatics Models, Methods, and Algorithms
    • 発表場所
      Rome, Italy
    • 年月日
      2016-02-21 – 2016-02-23
    • 国際学会
  • [学会発表] 文字列データの統計的クラスタリングのための Laplace 様混合モデルと EM アルゴリズムの理論2015

    • 著者名/発表者名
      小谷野仁
    • 学会等名
      日本応用数理学会
    • 発表場所
      金沢大学
    • 年月日
      2015-09-09 – 2015-09-11
  • [学会発表] 文字列の集合上の Laplace 様混合モデルと EM アルゴリズムに基づく文字列クラスタリグ2015

    • 著者名/発表者名
      小谷野仁
    • 学会等名
      日本情報処理学会
    • 発表場所
      沖縄先端科学技術大学院大学
    • 年月日
      2015-06-23 – 2015-06-25

URL: 

公開日: 2017-01-06  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi