研究概要 |
経営工学をはじめ多くの分野では,ものごとを「分類」あるいは「判別」するための手法が研究されてきた.近年,サポートベクターマシン(SVM)と呼ばれる数値的最適化を用いた判別手法が注目されている.そこで,本研究では,大規模データに対し,高速に判別関数を算出する新たなアルゴリズムを提案し,さらに,実用に供する実装を行い,従来そのデータ量の膨大さゆえ,適用がなされていなかった分野への応用について研究をおこなった.これには,primal問題による定式化を用いたアルゴリズムを発展させ,切除平面法を用いたアルゴリズムを構築した.具体的には, 1.切除平面の構成方法に関する改良点 一般に,最も計算を困難にしている点は,非常に巨大な実対称行列を扱わなくてはならい点である.本研究の切除平面法では,切除平面の構成には行列の要素を全ては必要とせず,一部の列からなる部分行列を扱うことで,極めて高速に構成可能とした. 2.切除平面の追加と削除 切除平面法のアルゴリズムは,逐次的に切除平面を追加しつつ,最適解へと収束する点列を生成する.この際,生成した切除平面全てを常に用いることは効率的でない.そのため,いくつかのヒューリスティックを提案し,アルゴリズムの過程で構成された切除平面の中から,不必要なものを選択し削除する方法を提案した. 3.近似アプローチの検討 判別問題の場合には,必ずしも厳密な最適化を行わなくとも十分に強力な判別関数が構成できる.そこで,最適性のチェックに工夫を加え計算時間を短縮することが可能となった.
|