• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

構造的データに潜む知識を効果的に発見するためのデータマイニングと機械学習

研究課題

研究課題/領域番号 22500135
研究機関広島市立大学

研究代表者

宮原 哲浩  広島市立大学, 情報科学研究科, 准教授 (90209932)

研究分担者 内田 智之  広島市立大学, 情報科学研究科, 准教授 (70264934)
廣渡 栄寿  北九州市立大学, 基盤教育センター, 教授 (60274429)
キーワードデータマイニング / 機械学習 / 木構造データ / 遺伝的プログラミング
研究概要

本研究課題では構造的データに潜む知識を効果的に発見するためのデータマイニングと機械学習について研究を行った.本研究の目的は,非均質で構造化された大規模なデータに潜む多様な知識の発見に焦点を当てて,必要とされる構造的知識を発見するためのデータマイニングと機械学習における新しい基盤技術を開発することである.本年度は構造的データとして木構造データを対象にした機械学習に重点をおき,次の成果を得た.
クラスタリングと進化的手法(遺伝的プログラミング)を用いて,複合的木構造パターンを学習する方法を提案した.タグ木パターンと呼ぶ木構造パターンの集合を,統合的なパターンとして扱う.タグ木パターンの構造的変数には任意の木を代入できる.タグ木パターン集合が木にマッチするとは,その集合の少なくとも一つのパターンがその木にマッチするときにいう.提案手法では,正データ間の木の編集距離と多次元尺度法に基づいて,正データのクラスタ数を決定する,正データをクラスタリングし,それぞれのクラスタと負データを合わせたデータに対して遺伝的プログラミングの部分過程を走らせて,各部分過程における最良の個体を統合して最終的な仮説を生成する.提案手法を糖鎖データに対して適用し,特徴的な複合的木構造パターンを獲得した.
無順序木に対する新しい距離尺度Broom Distanceと高速な計算アルゴリズムを提案した.また,木構造を2分木コードとよぶ文字列に変換して,文字列の編集距離により,木の編集距離を近似するアルゴリズムを提案した.

  • 研究成果

    (3件)

すべて 2011 2010

すべて 雑誌論文 (3件) (うち査読あり 3件)

  • [雑誌論文] Learning of Multiple Tree Structured Patterns using Clustering and Evolution2011

    • 著者名/発表者名
      Y.Otsuka, T.Miyahara, T.Kuboyama
    • 雑誌名

      Proceedings of IADIS Internatinal Conference Information Systems 2011

      ページ: 227-231

    • 査読あり
  • [雑誌論文] Broom Distance between Rooted Labeled Trees2011

    • 著者名/発表者名
      T.Kuboyama, K.Hirata
    • 雑誌名

      Proceedings of 7th Workshop on Learning with Logics and Logics for Learning (LLLL 2011)

      ページ: 34-41

    • 査読あり
  • [雑誌論文] Approximating Tree Edit Distance through String Edit Distance for Binary Tree Codes2010

    • 著者名/発表者名
      T.Aratsu, K.Hirata, T.Kuboyama
    • 雑誌名

      Fundamenta Informaticae

      巻: Vol.101, No.3 ページ: 157-171

    • 査読あり

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi