• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

アルゴリズムによって正当性を保証する知識発見手法の構築

Research Project

Project/Area Number 10J05714
Research Category

Grant-in-Aid for JSPS Fellows

Allocation TypeSingle-year Grants
Section国内
Research Field Intelligent informatics
Research InstitutionKyoto University

Principal Investigator

杉山 麿人  京都大学, 情報学研究科, 特別研究員DC2

Project Period (FY) 2010 – 2011
Project Status Completed (Fiscal Year 2011)
Budget Amount *help
¥1,400,000 (Direct Cost: ¥1,400,000)
Fiscal Year 2011: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 2010: ¥700,000 (Direct Cost: ¥700,000)
Keywords機械学習 / 知識発見 / 離散化 / クラスタリング / グレイコード / 半教師あり学習 / 順序学習 / 形式概念解析 / フラクタル / グレイ符号
Research Abstract

本研究では,対象の離散化と機械学習の2つのプロセスを融合するという方針に基づき,理論的に仮定されるアナログデータと,実際に計算機上で扱われるデジタルデータのギャップを埋めることを主眼として,離散化を取り込んだ具体的な機械学習アルゴリズムを提案した.まず,符号化による実数値データの離散化過程をクラスタリングそのものと同一視することで,実数の符号化方式に基づきクラスタリングの結果を評価する新しい尺度MCLを提案し,その尺度のもとで最適なクラスタを発見するアルゴリズムCOOLを構築した.グレイコードを用いることで,内的結合と外的分離を達成しつつ,任意形状のクラスタを発見可能であることを理論的に示した.また,この結果を発展させることで,任意形状のクラスタを抽出し,かつ高速なクラスタリングのアルゴリズムBOOLを提案した.これは,任意形状のクラスタを抽出可能なアルゴリズムとしては世界最速であり,他研究が提案したものよりも100~1000倍高速に動作する.さらに,半教師あり学習と順序学習というさらに複雑な機械学習のタスクと,その生物学データへの応用に取り組んだ.形式概念解析を利用することで,離散値と連続値が混在するデータから,クラスの分類とランキングを半教師あり学習によって達成するアルゴリズムSELFを提案した.また,生物学データベースからのリガンド候補の発見を,半教師ありのマルチラベルクラス分類問題として定式化した上で,その問題を解くアルゴリズムLIFTを構築した.実データを用いた実験によって,既存手法よりも良い精度でリガンド候補が発見できることを示した.これらの研究は,離散的な空間における位相的・代数的構造が連続値からの機械学習において有効に機能するという新たな知見を提供している.

Report

(2 results)
  • 2011 Annual Research Report
  • 2010 Annual Research Report
  • Research Products

    (18 results)

All 2012 2011 2010 Other

All Journal Article (9 results) (of which Peer Reviewed: 9 results) Presentation (7 results) Remarks (2 results)

  • [Journal Article] Semi-Supervised Ligand Finding Using Formal Concept Analysis2012

    • Author(s)
      Sugiyama, M., Imajo, K., Otaki, K., Yamamoto, A.
    • Journal Title

      IPSJ Transactions on Mathematical Modeling and Its Applications

      Volume: (未定)(印刷中)

    • Related Report
      2011 Annual Research Report
    • Peer Reviewed
  • [Journal Article] A Fast and Flexible Clustering Algorithm Using Binary Discretization2011

    • Author(s)
      Sugiyama, M., Yamamoto, A.
    • Journal Title

      Proceedings of the 2011 IEEE International Conference on Data Mining (ICDM 2011)

      Volume: (未定)(印刷中) Pages: 1212-1217

    • DOI

      10.1109/icdm.2011.9

    • Related Report
      2011 Annual Research Report
    • Peer Reviewed
  • [Journal Article] High-throughput Data Stream Classification on Trees2011

    • Author(s)
      Sugiyama, M., Yamamoto, A.
    • Journal Title

      Proceedings of Second Workshop on Algorithms for Large-Scale Information Processing in Knowledge Discovery (ALSIP 2011)

    • Related Report
      2011 Annual Research Report
    • Peer Reviewed
  • [Journal Article] The Minimum Code Length for Clustering Using the Gray Code2011

    • Author(s)
      Sugiyama, M., Yamamoto, A.
    • Journal Title

      Machine Learning and Knowledge Discovery in Databases

      Volume: 6913 Pages: 365-380

    • DOI

      10.1007/978-3-642-23808-6_24

    • ISBN
      9783642238079, 9783642238086
    • Related Report
      2011 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Semi-Supervised Learning for Mixed-Type Data via Formal Concept Analysis2011

    • Author(s)
      Sugiyama, M., Yamamoto, A.
    • Journal Title

      Conceptual Structures for Discovering Knowledge

      Volume: 6828 Pages: 284-297

    • DOI

      10.1007/978-3-642-22688-5_21

    • ISBN
      9783642226878, 9783642226885
    • Related Report
      2011 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Fast Clustering Based on the Gray-Code2011

    • Author(s)
      Sugiyama, M., Yamamoto, A.
    • Journal Title

      Proceedings of Seventh Workshop on Learning with Logics and Logics for Learning (LLLL2011)

      Pages: 42-42

    • Related Report
      2010 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Semi-Supervised Learning for Mixed-Type Data via Formal Concept Analysis2011

    • Author(s)
      Sugiyama, M., Yamamoto, A.
    • Journal Title

      Proceedings of the 19th International Conference on Conceptual Structures (ICCS2011)

      Volume: (掲載確定)

    • Related Report
      2010 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Learning Figures with the Hausdorff Metric by Fractals2010

    • Author(s)
      Sugiyama, M., Hirowatari, E., Tsuiki, H., Yamamoto, A.
    • Journal Title

      Algorithmic Learning Theory, Lecture Notes in Computer Science

      Volume: 6331 Pages: 315-329

    • Related Report
      2010 Annual Research Report
    • Peer Reviewed
  • [Journal Article] The Coding Divergence for Measuring the Complexity of Separating Two Sets2010

    • Author(s)
      Sugiyama, M., Yamamoto, A.
    • Journal Title

      Proceedings of 2nd Asian Conference on Machine Learning (ACML2010), JMLR Workshop and Conference Proceedings

      Volume: 13 Pages: 127-143

    • Related Report
      2010 Annual Research Report
    • Peer Reviewed
  • [Presentation] 符号化ダイバージェンスを用いたクラス分類のためのオンラインアルゴリズム2011

    • Author(s)
      吉岡正志, 杉山麿人, 山本章博
    • Organizer
      第4回情報論的学習理論と機械学習研究会(IBISML)
    • Place of Presentation
      大阪
    • Year and Date
      2011-03-28
    • Related Report
      2010 Annual Research Report
  • [Presentation] Discovering Ligands for TRP Ion Channels Using Formal Concept Analysis2011

    • Author(s)
      Sugiyama, M., Imajo, K., Otaki, K., Yamamoto, A.
    • Organizer
      The 21st International Conference on Inductive Logic Programming (ILP 2011)
    • Place of Presentation
      Windsor Great Park, UK
    • Related Report
      2011 Annual Research Report
  • [Presentation] Semi-Supervised Ligand Finding Using Formal Concept Analysis2011

    • Author(s)
      Sugiyama, M., Imajo, K., Otaki, K., Yamamoto, A.
    • Organizer
      第86回MPS・第27回BIO合同研究発表会
    • Place of Presentation
      電気通信大学
    • Related Report
      2011 Annual Research Report
  • [Presentation] 2進符号化を活用した高速かつ柔軟なクラスタリング2011

    • Author(s)
      杉山麿人, 山本章博
    • Organizer
      第25回人工知能学会全国大会
    • Place of Presentation
      アイーナいわて県民情報交流センター
    • Related Report
      2011 Annual Research Report
  • [Presentation] 離散量と連続量が混在するデータに対する形式概念分析を用いた半教師あり学習2010

    • Author(s)
      杉山麿人, 山本章博
    • Organizer
      第80回人工知能基本問題研究会(SIG-FPAI)
    • Place of Presentation
      東京
    • Year and Date
      2010-11-17
    • Related Report
      2010 Annual Research Report
  • [Presentation] グレイ符号化ダイバージェンスによる連続データからの計算論的知識発見2010

    • Author(s)
      杉山麿人, 山本章博
    • Organizer
      第78回人工知能基本問題研究会(SIG-FPAI)
    • Place of Presentation
      兵庫
    • Year and Date
      2010-07-31
    • Related Report
      2010 Annual Research Report
  • [Presentation] 符号化ダイバージェンスによる2つの集合の異なり具合の定量化2010

    • Author(s)
      杉山麿人, 山本章博
    • Organizer
      第1回情報論的学習理論と機械学習研究会(IBISML)
    • Place of Presentation
      東京
    • Year and Date
      2010-06-15
    • Related Report
      2010 Annual Research Report
  • [Remarks]

    • URL

      http://mahito.info

    • Related Report
      2011 Annual Research Report
  • [Remarks]

    • URL

      http://www.iip.ist.i.kyoto-u.ac.jp/member/mahito/

    • Related Report
      2010 Annual Research Report

URL: 

Published: 2010-12-03   Modified: 2024-03-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi