• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2005 年度 実績報告書

構造を持つ生物情報データからの共通パターン抽出法

研究課題

研究課題/領域番号 16300092
研究機関京都大学

研究代表者

阿久津 達也  京都大学, 化学研究所, 教授 (90261859)

研究分担者 上田 展久  京都大学, 化学研究所, 助手 (80346048)
宮野 悟  東京大学, 医科学研究所, 教授 (50128104)
丸山 修  九州大学, 大学院・数理学研究院, 助教授 (20282519)
キーワードグラフカーネル / 特徴ベクトル / 木構造 / アルゴリズム / 編集距離 / タンパク質細胞内局在部位予測 / サポートベクターマシン / パターンマッチング
研究概要

本基盤研究では本年度、主に以下の三種類のテーマに関する研究を行った:1.パスの出現頻度に基づく特徴ベクトルからのグラフ構造の推定法、2.木構造の比較アルゴリズム、3.タンパク質配列の細胞内局在部位予測。
1.化合物の分類のために、様々なグラフカーネルが提案されている。それらの多くでは、各グラフ構造は、ラベルつきパスの出現頻度に基づいて特徴ベクトルに写像される。そこで、これらの特徴ベクトルが与えられた時に、もとのグラフ構造を推定する問題について考察した。そして、特徴ベクトルに含まれるパスの長さが定数以下で、かつ、対象となるグラフが次数限定の木である場合に、特徴ベクトルから多項式時間で推定するためのアルゴリズムを開発した。また、この問題が一般にはNP困難となることも示した。
2.順序付き木の構造比較のために、木の編集距離という測度が提案され広く利用されている。しかしながら、現在のところ最速のアルゴリズムでも0(n^3 log n)時間を要する。そこで、最適性を多少損なっても、高速に動作するアルゴリズムを開発した。このアルゴリズムは0(n^2)時間で動作し、木の高さに比例する近似精度以内で編集距離を計算する。
3.タンパク質は種類によって細胞内の各器官に輸送されてその機能を発現するが、タンパク質配列データからどの器官に輸送されるかを推定する問題はタンパク質細胞内局在部位予測と呼ばれ多くの研究が行われている。本研究ではタンパク質配列を3個の領域に分け、それぞれの領域から特徴パターンを抽出し、それを特徴ベクトルとしてサポートベクターマシンに適用して予測を行う手法を開発した。ベンチマークデータを用いた計算機実験の結果、配列データのみから予測を行う手法としては最高レベルの予測精度が得られることがわかった。さらに、この予測手法を用いて予測を行うWEBサーバーを開発し、公開した。

  • 研究成果

    (6件)

すべて 2005

すべて 雑誌論文 (6件)

  • [雑誌論文] Inferring a graph from path frequency2005

    • 著者名/発表者名
      T.Akutsu, D.Fukagawa
    • 雑誌名

      Lecture Notes in Computer Science 3537

      ページ: 371-382

  • [雑誌論文] Fast and accurate database homology search using upper bounds of local alignment scores2005

    • 著者名/発表者名
      M.Itoh, S.Goto, T.Akutsu, M.Kanehisa
    • 雑誌名

      Bioinformatics 21

      ページ: 912-921

  • [雑誌論文] Graph kernels for molecular structure-activity relationship analysis with support vector machines2005

    • 著者名/発表者名
      P.Mahe, N.Ueda, T.Akutsu, J-L.Perret J-P.Vert
    • 雑誌名

      Journal of Chemical Information and Modeling 45

      ページ: 939-951

  • [雑誌論文] A novel representation of protein sequences for prediction of subcellular location using support vector machines2005

    • 著者名/発表者名
      S.Matsuda, J-P.Vert, H.Saigo, N.Ueda, H.Toh, T.Akutsu
    • 雑誌名

      Protein Science 14

      ページ: 2804-2813

  • [雑誌論文] Reconstructing phylogenetic trees of prokaryote genomes by randomly sampling oligopeptides2005

    • 著者名/発表者名
      O.Maruyama, A.Matsuda, S.Kuhara
    • 雑誌名

      Proc.International Conference on Computational Science

      ページ: 911-918

  • [雑誌論文] Superiority of network motifs over optimal networks and an application to the revelation of gene network evolution2005

    • 著者名/発表者名
      S.Ott, A.Hansen, S.Kim, S.Miyano
    • 雑誌名

      Bioinformatics 21

      ページ: 227-238

URL: 

公開日: 2007-04-02   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi