• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

構造を持つ生物情報データからの共通パターン抽出法

研究課題

研究課題/領域番号 16300092
研究機関京都大学

研究代表者

阿久津 達也  京都大学, 化学研究所, 教授 (90261859)

研究分担者 林田 守広  京都大学, 化学研究所, 助手 (40402929)
宮野 悟  東京大学, 医科学研究所, 教授 (50128104)
丸山 修  九州大学, 大学院数理学研究院, 助教授 (20282519)
キーワード特徴ベクトル / 木構造 / 平面的グラフ / オイラー文字列 / 編集距離 / クラスタリング / タンパク質配列 / 生物情報ネットワーク
研究概要

本基盤研究では本年度、主に以下の三種類のテーマに関して研究を行った:1.特徴ベクトルからのグラフ構造の推定法、2.木構造の比較アルゴリズム、3.グラフの極大成分を用いたネットワークのクラスタリング手法。
1.パスの出現頻度に基づく特徴ベクトルからのグラフ構造の推定法は平成17年度より開始した研究テーマであり、新規な化学構造を見出すために有用であると考えられる。平成17年度の研究においては、パスの頻度からなる特徴ベクトルから木構造を推定するアルゴリズムを開発したが、平成18年度は、この結果を、小さな部分構造の出現頻度からなる特徴ベクトルから木構造および外平面的グラフ構造を持つ化学構造を推定するように拡張した。また、実際に動作するアルゴリズムの開発も行い、分枝限定法を用いて、パスの出現頻度からなる特徴ベクトルから木に似た構造を持つ化学構造を推定するアルゴリズムを開発した。そして、計算機実験により、(水素原子を除いて)十数原子からなる化合物の推定に適用できることを示した。
2.木構造の編集距離をオイラー文字列の編集距離を用いて高速に近似するアルゴリズムを平成17年度に開発した。しかしながら、木の高さが大きい場合には意味のある近似精度が得られないという欠点があった。そこで、オイラー文字列に部分木の情報を巧妙に埋め込むことにより、木の高さが大きい場合にも近似精度を保証できるアルゴリズムを開発した。
3.代謝ネットワーク、タンパク質相互作用ネットワーク、遺伝子ネットワークなどの生物情報ネットワークデータから、グラフをクラスタリングすることによりデータを分類することはバイオインフォマティクスにおける重要な問題である。これまでに様々な方法が提案されてきたが、グラフの構造に深く着目した研究はあまり行われてこなかった。そこで、本研究では、辺連結度をもとに定義されるグラフの極大成分に基づく階層的クラスタリング手法を、生物情報ネットワークに適用する手法を開発した。開発した手法をタンパク質配列の類似度を辺の重みとするネットワークのクラスタリングに適用したところ、最短距離法、群平均距離法をいった従来手法と比較し、より良好な結果を得ることができた。

  • 研究成果

    (7件)

すべて 2007 2006

すべて 雑誌論文 (6件) 図書 (1件)

  • [雑誌論文] A novel clustering method for analysis of biological networks using maximal components of graphs2007

    • 著者名/発表者名
      M.Hayashida, T.Akutsu, H.Nagamochi
    • 雑誌名

      Proc. 5th Asia Pasific Bioinformatics Conference

      ページ: 257-266

  • [雑誌論文] Optimizing amino acid substitution matrices with a local alignment kernel2006

    • 著者名/発表者名
      H.Saigo, J-P.Vert, T.Akutsu
    • 雑誌名

      BMC Bioinformatics 7

      ページ: 246

  • [雑誌論文] A relation between edit distance for ordered trees and edit distance for Euler strings2006

    • 著者名/発表者名
      T.Akutsu
    • 雑誌名

      Information Processing Letters 100

      ページ: 105-109

  • [雑誌論文] Algorithms for point set matching with k-differences2006

    • 著者名/発表者名
      T.Akutsu
    • 雑誌名

      International Journal of Foundations of Computer Science 17

      ページ: 903-917

  • [雑誌論文] Approximating tree edit distance through string edit distance2006

    • 著者名/発表者名
      T.Akutsu, D.Fukagawa, A.Takasu
    • 雑誌名

      Lecture Notes in Computer Science 4288

      ページ: 90-99

  • [雑誌論文] A weighted profile based method for protein-RNA interacting residue prediction2006

    • 著者名/発表者名
      E.Jeong, S.Miyano
    • 雑誌名

      Trans. Computational Systems Biology IV

      ページ: 123-139

  • [図書] バイオインフォマティクスの数理とアルゴリズム2007

    • 著者名/発表者名
      阿久津達也
    • 総ページ数
      223
    • 出版者
      共立出版

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi