• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

1998 Fiscal Year Annual Research Report

ゲノムデータベースからの網羅的データマイニングに関する研究

Research Project

Project/Area Number 09780314
Research InstitutionJapan Advanced Institute of Science and Technology

Principal Investigator

佐藤 賢二  北陸先端科学技術大学院大学, 知識科学研究科, 助教授 (10215783)

Keywordsデータマイニング / 相関ルール発見 / 演繹データベース / 分子生物学 / ゲノム解析 / タンパク質立体構造表示
Research Abstract

指数関数的に増大し続けるゲノムデータベースから自動的に有用な知識を発見することの重要性が近年指摘されている。これに対し筆者らはデータベース研究の分野で注目されているデータマイニング手法を用いた知識発見について研究を行なっている。しかし、大量かつ多種多様なゲノムデータベースか網羅的に知識発見を行なうためには、知識発見のエンジンと各種のデノム解析ソフトウェアをどのように相関ルール発見システムに統合していくかが大きな問題である。
本年度は、前年度に開発したプロトタイプの改良を行なった。まず、可視化モジュール(PDB high-light)を改良することにより、類似構造検索モジュール(PACADE)およびデータマイニングモジュールからの呼出機構を強化し、さらに外部のゲノム解析プログラム(例えばFASTAなどのホモロジー検索)からも容易に呼び出せるような汎用的なパラメータ受渡しを行なうモジュールとしてPDB hige-lightを再実装した。また、可視化結果をもとに外部の解析/検索システムを容易に呼び出せる機能を付加した。これにより、ゲノムネット(http://www.genome.ad.jp/)が保有する各種ゲノムデータベースとの連係が容易になり、日々更新されるデータに対して検索/可視可/マイニングの3つを有機的に結びつけたサービスを構築できた。現在この統合サービス(WebPACADE)は、ゲノムネット上でWWWを通して公開され、利用されている。
WebPACADEのデータマイニングモジュールは主に蛋白質関連の知識発見を行なうが、このモジュールを元に、ゲノムネット上の20種におよぶ各種ゲノムデータを組み合せて網羅的に知識発見を行なうモジュールを開発した。一般にこのような大規模異種データベースからの相関ルール発見は計算量爆発に陥り実行不可能であるが、探索空間となるデータベースを限定し、さらに相関ルール発見の核となる微小なデータ集合を、利用者の興味に応じて指定させることで回避できることが示された。

  • Research Products

    (2 results)

All Other

All Publications (2 results)

  • [Publications] 古市恵美子他3名: "WebPACADEの類似構造検索機能を用いたタンパク質のクラスタリング" 第21回日本分子生物学会年会. 348-348 (1998)

  • [Publications] 中西由紀子他4名: "データマイニングを利用したタンパク質の機能・構造間相関ルール抽出" 第21回日本分子生物学会年会. 348-348 (1998)

URL: 

Published: 1999-12-11   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi