研究概要 |
経営工学をはじめ多くの分野では,ものごとを「分類」あるいは「判別」するための手法が研究されてきた.近年,サポートベクターマシン(SVM)と呼ばれる数値的最適化を用いた判別手法が注目され高い予測性能を発揮できることが報告されている.そこで,本研究では,従来と異なる枠組みでSVMを再構築し,新たな高速アルゴリズムの提案を行った.また,実用に供する実装を行い,従来そのデータ量の膨大さゆえ適用がなされていなかった分野への応用を行った. その結果,切除平面法により2クラスおよび多クラス問題に対するアルゴリズムの開発および計算機への実装を行った.本研究の切除平面法では,切除平面の構成には行列の要素を全ては必要とせず,一部の列からなる部分行列を扱うことで,極めて高速なプログラムの実装に成功した.また,いくつかのヒューリスティックを実装し,アルゴリズムの過程で構成された切除平面の中から不必要なものを選択し削除するアルゴリズムの構築を行った.さらに,SVMでの判別境界を用いた属性抽出法を提案した.この属性抽出法の場合,境界上の点の座標の効率的な算出法を手案した. 本研究で開発したアルゴリズムの有効性を検証するため,大手クレジットカード会社より提供を受けた現実のデータを用いて,購買者予測,商品の推薦といった問題を扱った.このデータは,数十万から数百万のレコードから構成されている従来では分析のできなかった大規模なものであるが,提案手法により,高速に判別が行えることを実証することができた.また,提案した属性抽出法を用いて,判別への寄与度の高い属性のみを選択して分析を行うことで,判別精度や汎化能力の向上が認められることも確認された.
|