• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2010 Fiscal Year Annual Research Report

アルゴリズムによって正当性を保証する知識発見手法の構築

Research Project

Project/Area Number 10J05714
Research InstitutionKyoto University

Principal Investigator

杉山 麿人  京都大学, 情報学研究科, 特別研究員(DC2)

Keywords機械学習 / 知識発見 / 離散化 / フラクタル / グレイ符号 / クラスタリング / 形式概念解析 / 半教師あり学習
Research Abstract

本研究の目的は,アルゴリズム的に正当性を保証する数値データからの知識発見手法を構築することである.この達成のため,まず知識発見を誤差という付加尺度を持つ離散量からの学習として定式化し,学習可能性を理論的に解析した.学習に用いるデータをユークリッド空間での超立方体として捉え,そこからコンパクト集合を学習するアルゴリズムを構築した.その結果,この学習過程にフラクタル性が潜んでいることを発見し,理論的解析によって,学習可能なフラクタルやコンパクト集合のクラスを明らかにした.さらに,誤差が次第に小さくなっていくという観測によるデータの獲得過程が,実数値データを2進数でコーディングする過程と類似することに着目し,この観点から知識発見を定式化した.その結果,2つの実数値データ集合間の類似度を計算論的に測ることに成功し,新規の尺度として符号化ダイバージェンスを提案した.さらにこの結果を発展させ,計算可能性をアルゴリズム的に保証した知識発見のための尺度として,グレイ符号とよばれる符号化法に基づくグレイ符号化ダイバージェンスを提案した.最近傍法によるクラス分類問題に適用することで,性能を定量的に評価し,その有効性を確認した.さらに,符号化ダイバージェンスを一般化することで,クラスタリングの結果を測る新規の尺度としてMCLを提案した.そして,MCLをクラスタリングの基準として採用し,グレイ符号化のもとで最適化問題を解くことで,高速かつ頑健なクラスタリングを実現した.また,頻出パターンマイニングに用いられている代数的手法である形式概念解析を用いることで,データがなす束構造を有効に利用し,離散値・連続値混在データからの半教師あり学習手法を提案した.これらの提案手法は,これまで統計学を基礎としてきた機械学習・知識発見分野に新たな観点を提供する.

  • Research Products

    (9 results)

All 2011 2010 Other

All Journal Article (4 results) (of which Peer Reviewed: 4 results) Presentation (4 results) Remarks (1 results)

  • [Journal Article] Fast Clustering Based on the Gray-Code2011

    • Author(s)
      Sugiyama, M., Yamamoto, A.
    • Journal Title

      Proceedings of Seventh Workshop on Learning with Logics and Logics for Learning (LLLL2011)

      Pages: 42

    • Peer Reviewed
  • [Journal Article] Semi-Supervised Learning for Mixed-Type Data via Formal Concept Analysis2011

    • Author(s)
      Sugiyama, M., Yamamoto, A.
    • Journal Title

      Proceedings of the 19th International Conference on Conceptual Structures (ICCS2011)

      Volume: (掲載確定)

    • Peer Reviewed
  • [Journal Article] Learning Figures with the Hausdorff Metric by Fractals2010

    • Author(s)
      Sugiyama, M., Hirowatari, E., Tsuiki, H., Yamamoto, A.
    • Journal Title

      Algorithmic Learning Theory, Lecture Notes in Computer Science

      Volume: 6331 Pages: 315-329

    • Peer Reviewed
  • [Journal Article] The Coding Divergence for Measuring the Complexity of Separating Two Sets2010

    • Author(s)
      Sugiyama, M., Yamamoto, A.
    • Journal Title

      Proceedings of 2nd Asian Conference on Machine Learning (ACML2010), JMLR Workshop and Conference Proceedings

      Volume: 13 Pages: 127-143

    • Peer Reviewed
  • [Presentation] 符号化ダイバージェンスを用いたクラス分類のためのオンラインアルゴリズム2011

    • Author(s)
      吉岡正志, 杉山麿人, 山本章博
    • Organizer
      第4回情報論的学習理論と機械学習研究会(IBISML)
    • Place of Presentation
      大阪
    • Year and Date
      2011-03-28
  • [Presentation] 離散量と連続量が混在するデータに対する形式概念分析を用いた半教師あり学習2010

    • Author(s)
      杉山麿人, 山本章博
    • Organizer
      第80回人工知能基本問題研究会(SIG-FPAI)
    • Place of Presentation
      東京
    • Year and Date
      2010-11-17
  • [Presentation] グレイ符号化ダイバージェンスによる連続データからの計算論的知識発見2010

    • Author(s)
      杉山麿人, 山本章博
    • Organizer
      第78回人工知能基本問題研究会(SIG-FPAI)
    • Place of Presentation
      兵庫
    • Year and Date
      2010-07-31
  • [Presentation] 符号化ダイバージェンスによる2つの集合の異なり具合の定量化2010

    • Author(s)
      杉山麿人, 山本章博
    • Organizer
      第1回情報論的学習理論と機械学習研究会(IBISML)
    • Place of Presentation
      東京
    • Year and Date
      2010-06-15
  • [Remarks]

    • URL

      http://www.iip.ist.i.kyoto-u.ac.jp/member/mahito/

URL: 

Published: 2012-07-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi