• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2002 Fiscal Year Annual Research Report

高度データベースの構築と検索

Research Project

Project/Area Number 12208007
Research InstitutionKyoto University

Principal Investigator

五斗 進  京都大学, 化学研究所, 助教授 (40263149)

Co-Investigator(Kenkyū-buntansha) 佐藤 賢二  北陸先端科学技術大学院大学, 知識科学研究科, 助教授 (10215783)
阿久津 達也  京都大学, 化学研究所, 教授 (90261859)
Keywords分子生物学データベース / 統合データベース / グリッド / 分子間相互作用 / 酵素反応 / グラフ比較 / 相関クラスタ / 経路探索
Research Abstract

高度データベースを構築するために、まず分子間の様々な関連を表現したデータを収集して、効率よく管理・検索するための枠組みを構築してきた。今年度は分子生物学データベース間のリンク情報を抽出してデータベース化したLinkDBのためのリンク抽出アルゴリズムの改良と、検索高速化のためのサフィックスアレイによるインデックス化を行った。また、大規模な分子生物学データベースを分散管理する手法として、グリッドコンピューティングを用いた分子生物学データベースの管理および検索に関する研究を行った。さらにこれらのデータベースから抽出したオントロジーを用いて、文献からの知識抽出を試みた。その結果、分子間の関係を抽出するためのテンプレートを自動的に生成することができるようになった。
分子同士を関係づけるための手法として以下の3つの手法を開発した。1)タンパク質の配列および立体構造情報からサポートベクターマシンを用いて2つのタンパク質が相互作用するかどうかを判定する手法。2)研究代表者らが開発しているLIGANDデータベースに登録されている酵素反応式において、反応の前後でどの部分が置き換わったかを推定するアルゴリズム。これを用いて化合物間の関連情報を抽出した。3)反応式を生化学の知識に基づき素反応に分解した上で、反応機構により反応を分類する手法。これにより似た反応を触媒する酵素間の関係を抽出できるようになる。
高度データベースの実装として、分子間の関連情報を収集してデータベース化したBRITEを構築してきたが、今年度は、そこから様々な知識を抽出するために以下の3つの手法を開発した。1)タンパク質間相互作用のデータからタンパク質中のどのドメインが相互作用に関わっているかを推定するための新しいアルゴリズム。2)これまでに開発してきた複数のネットワークから相関するクラスタを抽出するアルゴリズムの改良による、抽出に利用した中間データを同時に抽出する手法。これにより、2つのクラスタを関連づけている分子を特定することが容易になった。3)ベイズネットを用いた相互作用情報の有意性を検定する方法。これを癌細胞のマイクロアレイデータからの相互作用抽出に応用した。また、クラスタ抽出の応用面では代謝系の酵素-酵素の関係から、多くの生物種で保存されている機能的に重要と考えられる酵素ネットワークのクラスタを抽出した。

  • Research Products

    (6 results)

All Other

All Publications (6 results)

  • [Publications] Satou, K., Defago, X., Yamamoto, T., Konagaya, A.: "STAG : A system for integrated search and data mining for bioinformatics"CBI Journal. (In press). (2003)

  • [Publications] Oyama, T., Kitano, K., Satou, K., Ito, T.: "Extraction of knowledge on protein-protein interaction by association rule discovery"Bioinformatics. 18・5. 705-714 (2002)

  • [Publications] Dukka, B.K.C., Akutsu, T., Tomita, E., Seki, T., Fujiyama, A.: "Point matching under non-uniform distortions and protein side chain packing based on an efficient maximum clique algorithm"Genome Informatics. 13. 143-152 (2002)

  • [Publications] Akutsu, T., Bannai, H., Miyano, S., Ott, S.: "On the complexity of deriving position specific score matrices from examples"Lecture Notes in Computer Science. 2372. 168-177 (2002)

  • [Publications] Akutsu, T., Ott, S.: "Inferring a union of halfspaces from examples"Lecture Notes in Computer Science. 2387. 117-126 (2002)

  • [Publications] Yamada, T., Yamanishi, Y., Goto, S., Kanehisa, M.: "Extraction of modules from metabolic pathways with phylogenetic profile"Genome Informatics. 13. 353-354 (2002)

URL: 

Published: 2004-04-07   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi