• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

統計的学習による生命情報データからのマイニング

Research Project

Project/Area Number 07F07763
Research Category

Grant-in-Aid for JSPS Fellows

Allocation TypeSingle-year Grants
Section外国
Research Field Bioinformatics/Life informatics
Research InstitutionKyoto University

Principal Investigator

馬見塚 拓  Kyoto University, 化学研究所, 教授

Co-Investigator(Kenkyū-buntansha) HANCOCK Timothy Peter  京都大学, 化学研究所, 外国人特別研究員
Project Period (FY) 2007 – 2008
Project Status Completed (Fiscal Year 2008)
Budget Amount *help
¥1,900,000 (Direct Cost: ¥1,900,000)
Fiscal Year 2008: ¥1,100,000 (Direct Cost: ¥1,100,000)
Fiscal Year 2007: ¥800,000 (Direct Cost: ¥800,000)
Keywordsデータ統合 / 確率モデル / 統計的機械学習 / ネットワーク(グラフ) / 代謝パスウェイ / 遺伝子発現 / マルコフモデル / 決定木 / マイクロアレイ / 分類 / Mixture of experts
Research Abstract

本研究の目的は、生命科学の様々なデータを統合し、各データの解析のみからでは得られない新たな知識発見が可能な統計的手法を構築することである。特に近年の生命科学ではグラフやネットワークで表わされるデータが増えている。そこで、事例間の類似性すなわちグラフと事例の実数値ベクトルの2つを入力とする研究課題を設定した。具体的には、事例は遺伝子に相当し、グラフは遺伝子ネットワーク、実数値ベクトルは遺伝子の発現を表す。このデータにおいて、実数値ベクトルにラベル(クラス)が与えられている状況を考え、グラフ上での、実数値ベクトル(事例)の分類問題を設定した。この問題では、事例間の類似性を情報として利用可能なことにより、実数値ベクトルにより事例を単純に分類することに較べて精度の良い分類が期待できる。加えて、どのような類似性が分類に重要かという知識発見も可能である。この問題に対し、2つの解決手法を考案した。まずマルコフモデルの混合分布に基づくモデル・学習手法を構築した。この手法は、確率モデルであるためノイズや誤差に頑健であり、生命科学データに適していると考えられる。また、人工データのみならず遺伝子ネットワークおよび遺伝子発現の実データにおいて、手法の有効性を実証した。本成果は論文にまとめ現在投稿中である。次に再帰的な分割に基づく学習手法を構築した。この手法は、決定木の学習やグラフクラスタリングに類似しており、実際、決定木の学習にグラフクラスタリングのいくつかの標準的な分割基準を導入した場合とほぼ等価である。この手法は人工データのみならず実データでの実験により評価を行いGenome Informatics誌に発表を行った。

Report

(2 results)
  • 2008 Annual Research Report
  • 2007 Annual Research Report
  • Research Products

    (3 results)

All 2008

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (2 results)

  • [Journal Article] Semi-Supervised Graph Partitioning with Decision Trees2008

    • Author(s)
      Tim Hancock, Hiroshi Mamitsuka
    • Journal Title

      Genome Informatics 20

      Pages: 102-111

    • Related Report
      2008 Annual Research Report
    • Peer Reviewed
  • [Presentation] Active Pathway Identification and Classification with Probabilistic Ensembles2008

    • Author(s)
      Tim Hancock, Hiroshi Mamitsuka
    • Organizer
      2008 Annual Conference of the Japanese Society for Bioinformatics
    • Place of Presentation
      大阪
    • Year and Date
      2008-12-15
    • Related Report
      2008 Annual Research Report
  • [Presentation] Semi-Supervised Graph Partitioning with Decision Trees2008

    • Author(s)
      Tim Hancock, Hiroshi Mamitsuka
    • Organizer
      International Workhop on Bioinformatics and Systems Biology
    • Place of Presentation
      Berlin, Germany
    • Year and Date
      2008-06-09
    • Related Report
      2008 Annual Research Report

URL: 

Published: 2007-04-01   Modified: 2024-03-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi