研究概要 |
本研究は,「グラフカーネル」と呼ばれるカーネルを用い,分類性能が高く,しかも大規模なデータに対しても高速に判別や分類が可能となる新たな高速アルゴリズムの開発を目的とする.また,そのアルゴリズムを実用に耐えうるソフトウエアとして実装し,従来そのデータ量の膨大さゆえ適用が不可能と考えられていたマーケティングの分野への応用について研究を行う.具体的には,グラフ構造を用いたカーネル法に関する研究,その高速アルゴリズム構築と計算機への実装に関する研究,および大規模マーケティングデータへの適用に関する研究を行った. 本年度の研究では,ます,現在までに提案されているカーネル相互の関係を体系的にまとめた.その上で,この研究で提案する手法で扱うことが可能なカーネルのクラスを特徴付け,また,より広い範囲のカーネルを扱うことのできるよう定式化の工夫を行った.1SVM,vSVM,SV回帰,あるいはカーネルクラスタリングやカーネル主成分分析など,2クラス判別問題以外のカーネル法への拡張を行った.まずvSVMと呼ばれる問題で,グラフカーネルを効率よく扱うための新たな定式化を検討した.さらに1SVMやSV回帰へと同様のアイディアを発展させた.グラフカーネルでは,データとデータの関連性を,データをノードに対応させたグラフを構成することで表現しなくてはならない.本研究では,クラスタリング手法と組み合わせることで,あらかじめ近接性の高いデータを限定する,などを行い,近似的なk-nearest neighborグラフではあるが,スケーラビリティのある手法を構築した.クラスタ間の距離を求め,互いに近接した数個のクラスタに属するデータ間に限定して,k-nearest neighborを探索した.
|