• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

アルゴリズムによって正当性を保証する知識発見手法の構築

研究課題

研究課題/領域番号 10J05714
研究種目

特別研究員奨励費

配分区分補助金
応募区分国内
研究分野 知能情報学
研究機関京都大学

研究代表者

杉山 麿人  京都大学, 情報学研究科, 特別研究員DC2

研究期間 (年度) 2010 – 2011
研究課題ステータス 完了 (2011年度)
配分額 *注記
1,400千円 (直接経費: 1,400千円)
2011年度: 700千円 (直接経費: 700千円)
2010年度: 700千円 (直接経費: 700千円)
キーワード機械学習 / 知識発見 / 離散化 / クラスタリング / グレイコード / 半教師あり学習 / 順序学習 / 形式概念解析 / フラクタル / グレイ符号
研究概要

本研究では,対象の離散化と機械学習の2つのプロセスを融合するという方針に基づき,理論的に仮定されるアナログデータと,実際に計算機上で扱われるデジタルデータのギャップを埋めることを主眼として,離散化を取り込んだ具体的な機械学習アルゴリズムを提案した.まず,符号化による実数値データの離散化過程をクラスタリングそのものと同一視することで,実数の符号化方式に基づきクラスタリングの結果を評価する新しい尺度MCLを提案し,その尺度のもとで最適なクラスタを発見するアルゴリズムCOOLを構築した.グレイコードを用いることで,内的結合と外的分離を達成しつつ,任意形状のクラスタを発見可能であることを理論的に示した.また,この結果を発展させることで,任意形状のクラスタを抽出し,かつ高速なクラスタリングのアルゴリズムBOOLを提案した.これは,任意形状のクラスタを抽出可能なアルゴリズムとしては世界最速であり,他研究が提案したものよりも100~1000倍高速に動作する.さらに,半教師あり学習と順序学習というさらに複雑な機械学習のタスクと,その生物学データへの応用に取り組んだ.形式概念解析を利用することで,離散値と連続値が混在するデータから,クラスの分類とランキングを半教師あり学習によって達成するアルゴリズムSELFを提案した.また,生物学データベースからのリガンド候補の発見を,半教師ありのマルチラベルクラス分類問題として定式化した上で,その問題を解くアルゴリズムLIFTを構築した.実データを用いた実験によって,既存手法よりも良い精度でリガンド候補が発見できることを示した.これらの研究は,離散的な空間における位相的・代数的構造が連続値からの機械学習において有効に機能するという新たな知見を提供している.

報告書

(2件)
  • 2011 実績報告書
  • 2010 実績報告書
  • 研究成果

    (18件)

すべて 2012 2011 2010 その他

すべて 雑誌論文 (9件) (うち査読あり 9件) 学会発表 (7件) 備考 (2件)

  • [雑誌論文] Semi-Supervised Ligand Finding Using Formal Concept Analysis2012

    • 著者名/発表者名
      Sugiyama, M., Imajo, K., Otaki, K., Yamamoto, A.
    • 雑誌名

      IPSJ Transactions on Mathematical Modeling and Its Applications

      巻: (未定)(印刷中)

    • 関連する報告書
      2011 実績報告書
    • 査読あり
  • [雑誌論文] A Fast and Flexible Clustering Algorithm Using Binary Discretization2011

    • 著者名/発表者名
      Sugiyama, M., Yamamoto, A.
    • 雑誌名

      Proceedings of the 2011 IEEE International Conference on Data Mining (ICDM 2011)

      巻: (未定)(印刷中) ページ: 1212-1217

    • DOI

      10.1109/icdm.2011.9

    • 関連する報告書
      2011 実績報告書
    • 査読あり
  • [雑誌論文] High-throughput Data Stream Classification on Trees2011

    • 著者名/発表者名
      Sugiyama, M., Yamamoto, A.
    • 雑誌名

      Proceedings of Second Workshop on Algorithms for Large-Scale Information Processing in Knowledge Discovery (ALSIP 2011)

    • 関連する報告書
      2011 実績報告書
    • 査読あり
  • [雑誌論文] The Minimum Code Length for Clustering Using the Gray Code2011

    • 著者名/発表者名
      Sugiyama, M., Yamamoto, A.
    • 雑誌名

      Machine Learning and Knowledge Discovery in Databases

      巻: 6913 ページ: 365-380

    • DOI

      10.1007/978-3-642-23808-6_24

    • ISBN
      9783642238079, 9783642238086
    • 関連する報告書
      2011 実績報告書
    • 査読あり
  • [雑誌論文] Semi-Supervised Learning for Mixed-Type Data via Formal Concept Analysis2011

    • 著者名/発表者名
      Sugiyama, M., Yamamoto, A.
    • 雑誌名

      Conceptual Structures for Discovering Knowledge

      巻: 6828 ページ: 284-297

    • DOI

      10.1007/978-3-642-22688-5_21

    • ISBN
      9783642226878, 9783642226885
    • 関連する報告書
      2011 実績報告書
    • 査読あり
  • [雑誌論文] Fast Clustering Based on the Gray-Code2011

    • 著者名/発表者名
      Sugiyama, M., Yamamoto, A.
    • 雑誌名

      Proceedings of Seventh Workshop on Learning with Logics and Logics for Learning (LLLL2011)

      ページ: 42-42

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] Semi-Supervised Learning for Mixed-Type Data via Formal Concept Analysis2011

    • 著者名/発表者名
      Sugiyama, M., Yamamoto, A.
    • 雑誌名

      Proceedings of the 19th International Conference on Conceptual Structures (ICCS2011)

      巻: (掲載確定)

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] Learning Figures with the Hausdorff Metric by Fractals2010

    • 著者名/発表者名
      Sugiyama, M., Hirowatari, E., Tsuiki, H., Yamamoto, A.
    • 雑誌名

      Algorithmic Learning Theory, Lecture Notes in Computer Science

      巻: 6331 ページ: 315-329

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] The Coding Divergence for Measuring the Complexity of Separating Two Sets2010

    • 著者名/発表者名
      Sugiyama, M., Yamamoto, A.
    • 雑誌名

      Proceedings of 2nd Asian Conference on Machine Learning (ACML2010), JMLR Workshop and Conference Proceedings

      巻: 13 ページ: 127-143

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [学会発表] 符号化ダイバージェンスを用いたクラス分類のためのオンラインアルゴリズム2011

    • 著者名/発表者名
      吉岡正志, 杉山麿人, 山本章博
    • 学会等名
      第4回情報論的学習理論と機械学習研究会(IBISML)
    • 発表場所
      大阪
    • 年月日
      2011-03-28
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Discovering Ligands for TRP Ion Channels Using Formal Concept Analysis2011

    • 著者名/発表者名
      Sugiyama, M., Imajo, K., Otaki, K., Yamamoto, A.
    • 学会等名
      The 21st International Conference on Inductive Logic Programming (ILP 2011)
    • 発表場所
      Windsor Great Park, UK
    • 関連する報告書
      2011 実績報告書
  • [学会発表] Semi-Supervised Ligand Finding Using Formal Concept Analysis2011

    • 著者名/発表者名
      Sugiyama, M., Imajo, K., Otaki, K., Yamamoto, A.
    • 学会等名
      第86回MPS・第27回BIO合同研究発表会
    • 発表場所
      電気通信大学
    • 関連する報告書
      2011 実績報告書
  • [学会発表] 2進符号化を活用した高速かつ柔軟なクラスタリング2011

    • 著者名/発表者名
      杉山麿人, 山本章博
    • 学会等名
      第25回人工知能学会全国大会
    • 発表場所
      アイーナいわて県民情報交流センター
    • 関連する報告書
      2011 実績報告書
  • [学会発表] 離散量と連続量が混在するデータに対する形式概念分析を用いた半教師あり学習2010

    • 著者名/発表者名
      杉山麿人, 山本章博
    • 学会等名
      第80回人工知能基本問題研究会(SIG-FPAI)
    • 発表場所
      東京
    • 年月日
      2010-11-17
    • 関連する報告書
      2010 実績報告書
  • [学会発表] グレイ符号化ダイバージェンスによる連続データからの計算論的知識発見2010

    • 著者名/発表者名
      杉山麿人, 山本章博
    • 学会等名
      第78回人工知能基本問題研究会(SIG-FPAI)
    • 発表場所
      兵庫
    • 年月日
      2010-07-31
    • 関連する報告書
      2010 実績報告書
  • [学会発表] 符号化ダイバージェンスによる2つの集合の異なり具合の定量化2010

    • 著者名/発表者名
      杉山麿人, 山本章博
    • 学会等名
      第1回情報論的学習理論と機械学習研究会(IBISML)
    • 発表場所
      東京
    • 年月日
      2010-06-15
    • 関連する報告書
      2010 実績報告書
  • [備考]

    • URL

      http://mahito.info

    • 関連する報告書
      2011 実績報告書
  • [備考]

    • URL

      http://www.iip.ist.i.kyoto-u.ac.jp/member/mahito/

    • 関連する報告書
      2010 実績報告書

URL: 

公開日: 2010-12-03   更新日: 2024-03-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi