• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2008 年度 実績報告書

部分的類似構造の重ね合わせに基づく不均質データの多義的探索法の開発

研究課題

研究課題/領域番号 20700134
研究機関京都大学

研究代表者

瀧川 一学  京都大学, 化学研究所, 助教 (10374597)

キーワードデータマイニング / 部分構造探索 / アルゴリズム / 統計的機械学習
研究概要

近年の計測機器のハイスループット化、インターネット上の情報流通、各種記録システムの電子化などを受けて、明確な単一用途を想定しない大規模なデータが情報過剰気味に様々な形で収集されるようになり、規模面からもこれらのデータの計算機処理は急務である。しかし、こうした近年処理対象として期待されているデータ群は不均質かつ多義的な性質を持ち、実験計画を経てデータが計画的に収集されるという従来の統計学の前提から逸脱するため、従来型の統計手法で対処できないような効率・妥当性・規模耐性などに関する重大な問題に現在直面している。本計面ではこの問題について(1)データ点群の部分集合が成す凸包構造の族、(2)データ点そのものの部分的類似構造への分解、をもとに知識発見法を構成することを目指す。全体類似性ではなく局所類似性の多面的統合・合意形成によって不均質で単一的特徴がなく従来型の綺麗な分布を持たないデータ点群の処理を多面的にとらえるという提案に即して、まず本年度は(1)の観点から、与えられた点群を正例の部分集合を含み負例を含まない凸包の族で被覆する枠組によるノンパラメトリックなパターン分類法・探索的データ解析法およびその構成のためのいくつかのアルゴリズムを示し一定の効果を確認した。(2)については生物学で解析が待たれているDNA, タンパク質, 脂質とならぶ重要高分子である糖鎖が木構造であることを鑑みて、現在利用できる糖鎖構造データの部分的類似構造として、頻出部分木パターンを分析し、定義から出力が肥大しがちなこのマイニング問題に対して、出力のパラメトリック要約法を提案し、実際の糖鎖データの分析を行った。その結果、要約された頻出部分構造パターンは既知の様々な機能モチーフと多く合致が見られ、幅広いレベルの生物学的情報を内包する糖鎖構造データの部分的類似構造分析の多面的有効性が示唆されたと言える。

  • 研究成果

    (6件)

すべて 2009 2008

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (4件)

  • [雑誌論文] Convex sets as prototypes for classifying Patterns2009

    • 著者名/発表者名
      I. Takigawa, M. Kudo, A. Nakamura
    • 雑誌名

      Engineering Applications of Artificial Intelligence vol.22, no.1

      ページ: 101-108

    • 査読あり
  • [雑誌論文] Mining significant tree patterns in carbohydrate sugar chains2008

    • 著者名/発表者名
      H. Hashimoto, I. Takigawa, M. Shiga, M. Kanehisa, H. Mamitsuka
    • 雑誌名

      Bioinformatics vol.24, no.16

      ページ: i167-i173

    • 査読あり
  • [学会発表] Efficiently finding significant substructural patterns conserved in glycans2008

    • 著者名/発表者名
      I.Takigawa, K.Hashimoto, M.Shiga, M.Kanehisa, H.Mamitsuka
    • 学会等名
      2008 Annual conference of the Japanese Society for Bioinformatics
    • 発表場所
      Osaka, Japan
    • 年月日
      20081215-20081216
  • [学会発表] Classification by reflective convex hulls2008

    • 著者名/発表者名
      M.Kudo, I.Takigawa, A.Nakamura
    • 学会等名
      19th International conference on pattern recognition (ICPR2008)
    • 発表場所
      Tampa, Florida, USA
    • 年月日
      20081208-20081211
  • [学会発表] Mining significant tree patterns in carbohydrate sugar chains2008

    • 著者名/発表者名
      K. Hashimoto, I. Takigawa, M. Shiga, M. Kanehisa. H. Mamitsuka
    • 学会等名
      ECCB' 08 European Conference on Computational Biology
    • 発表場所
      Cagliari, Italy
    • 年月日
      20080922-26
  • [学会発表] 酵素遺伝子の発現情報に基づく効率的な代謝経路ランキング2008

    • 著者名/発表者名
      瀧川一学
    • 学会等名
      2008年度統計関連学会連合大会
    • 発表場所
      慶応義塾大学矢上キャンパス
    • 年月日
      20080907-10

URL: 

公開日: 2010-06-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi