2007 年度実績報告書

グラフ構造を用いた大規模な分類手法の構築とその実システムへの応用

研究課題

研究課題/領域番号	19510141
研究機関	東京工業大学
研究代表者	矢島安敏東京工業大学, 大学院・社会理工学研究科, 准教授 (80231645)
キーワード	パターン認識 / カーネル法 / SVM
研究概要	本研究は,「グラフカーネル」と呼ばれるカーネルを用い,分類性能が高く,しかも大規模なデータに対しても高速に判別や分類が可能となる新たな高速アルゴリズムの開発を目的とする.また,そのアルゴリズムを実用に耐えうるソフトウエアとして実装し,従来そのデータ量の膨大さゆえ適用が不可能と考えられていたマーケティングの分野への応用について研究を行う.具体的には,グラフ構造を用いたカーネル法に関する研究,その高速アルゴリズム構築と計算機への実装に関する研究,および大規模マーケティングデータへの適用に関する研究を行った. 本年度の研究では,ます,現在までに提案されているカーネル相互の関係を体系的にまとめた.その上で,この研究で提案する手法で扱うことが可能なカーネルのクラスを特徴付け,また,より広い範囲のカーネルを扱うことのできるよう定式化の工夫を行った.1SVM,vSVM,SV回帰,あるいはカーネルクラスタリングやカーネル主成分分析など,2クラス判別問題以外のカーネル法への拡張を行った.まずvSVMと呼ばれる問題で,グラフカーネルを効率よく扱うための新たな定式化を検討した.さらに1SVMやSV回帰へと同様のアイディアを発展させた.グラフカーネルでは,データとデータの関連性を,データをノードに対応させたグラフを構成することで表現しなくてはならない.本研究では,クラスタリング手法と組み合わせることで,あらかじめ近接性の高いデータを限定する,などを行い,近似的なk-nearest neighborグラフではあるが,スケーラビリティのある手法を構築した.クラスタ間の距離を求め,互いに近接した数個のクラスタに属するデータ間に限定して,k-nearest neighborを探索した.

研究成果
(2件)

すべて雑誌論文 (2件) (うち査読あり 2件)

[雑誌論文] Predicting Purchase Preferences Using Semi-Supervised One-Class SVM with Graph Kernels2007
- 著者名/発表者名
  Yajima, Y.
- 雑誌名
  
  Proc. of SCM 2007 (CD-ROM)
- 査読あり
[雑誌論文] Semi-Supervised Kernel Logistic Regression and its Extension to Active Learning based on A-optimality2007
- 著者名/発表者名
  Yajima, Y.
- 雑誌名
  
  Proc. of ICDM 2007 Workshops (CD-ROM)
- 査読あり