• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2009 年度 実績報告書

個々のデータに依存した問題の複雑さに関する研究

研究課題

研究課題/領域番号 21500128
研究機関北海道大学

研究代表者

中村 篤祥  北海道大学, 大学院・情報科学研究科, 准教授 (50344487)

研究分担者 工藤 峰一  北海道大学, 大学院・情報科学研究科, 教授 (60205101)
外山 淳  北海道大学, 大学院・情報科学研究科, 助教 (60197960)
キーワードデータ依存 / 問題の複雑さ / 機械学習
研究概要

本研究の目的は、問題クラスとしては難しいがデータによっては簡単に解ける問題に対し、データ依存の問題の複雑さの指標を提案し、その指標により単純な問題をより効率的に解くアルゴリズムを考案することである。
本年度は、そのような問題の1つである「Sperner族からなる概念クラスに属する概念の列挙」問題において、Sperner族からなる概念クラスCの複雑さの指標として、Cのintersection closureのVC次元を考え、この指標における複雑度が低いデータに対し、既存のアルゴリズムがより速く列挙できることを実験により確認した。この問題は、データマイニングの分野で盛んに研究されている「極大頻出アイテムセット列挙問題」、パターン認識で研究されている「サブクラス問題」をインスタンスとして含む。特に「サブクラス問題」では、属性数が10未満のデータに対してしか超矩形サブクラスの列挙ができていなかったが、「極大頻出アイテムセット列挙問題」のアルゴリズム(IBE,LCMmax)を改造することにより、属性数が10以上のいくつかのデータに対しても(1日以内で)列挙可能となった。
列挙されたサブクラスを識別やルール表現として使う場合、すべてのものを使うより、より少ない代表的なものを使う方が有効である場合が多い。そこで、与えられた正例集合の、サブクラスによる貪欲被覆を求める問題を応用として考え、列挙よりも効率的に行えるアルゴリズムを開発した。またこの方法により、簡潔なDNF(Disjunctive Normal Form)表現のルールが得られ、データマイニングにおいても有効であることが確かめられた。

  • 研究成果

    (3件)

すべて 2010 2009

すべて 雑誌論文 (3件) (うち査読あり 1件)

  • [雑誌論文] 超矩形による貪欲被覆学習の効率的実装と実データによる性能評価2010

    • 著者名/発表者名
      大内康治, 中村篤祥, 工藤峰一
    • 雑誌名

      電子情報通信学会技術報告書(情報論的学習理論と機械学習)

      巻: 110(265) ページ: 99-104

  • [雑誌論文] Classifier Selection in a Family of Polyhedron Classifiers2009

    • 著者名/発表者名
      Tetsuji Takahashi, Mineichi Kudo, Atsuyoshi Nakamura
    • 雑誌名

      LNCS (Proceedings of CLARP 2009)

      巻: 5856 ページ: 441-448

    • 査読あり
  • [雑誌論文] Adversarial Bandit Problems with Multiple Plays2009

    • 著者名/発表者名
      Taishi Uchiya, Atsuyoshi Nakamura
    • 雑誌名

      電子情報通信学会技術報告書(COMP2009)

      巻: 109(195) ページ: 13-20

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi