研究概要 |
サポートベクターマシーン(Support Vector Machine : SVM)は、あらかじめ分類されたデータに基づいて分類ルールを学習し、そのルールを適用して新たなデータを分類する手法であり、現実の問題への応用において優れた性能を持つことが報告されている。特に、ν-SVM[Scholkopf等,2000]はパラメータ選択が他のSVMに比べて容易なため、注目を集めている。 本研究では、統計的学習分野で広く研究が進められているSVMについて、数理最適化の知見を生かした研究を行なっている。 (1) ν-SVMの拡張モデルであるEν-SVM[Perez-Cruz等,2003]に対し、汎化誤差(新たなデータに対する予測誤差)を最も小さくするような判別関数がEν-SVMから得られることを理論的に示す。 (2) Eν-SVMモデルは非凸計画問題として定式化されるため、厳密解を求めるのは難しく、単純な局所最適解法が提案されているに留まっている。Eν-SVMを近似的に解くためのソフトウェア、厳密に解くためのソフトウェア、両方の開発を行なう。分類手法のためのデータベースが整っており、小・中規模データ集合を用いて、Eν-SVMの有効性の検証とともに考案解法の性能評価を行いたい。最終的には、データベースから特に大規模な実データ集合(医療データやクレジット会社の顧客データ)を用いて、与信審査・医療診断問題への実証的適用を行なう。 (3) Extended ν-SVMを金融データに適用することを試みる。観測データと同じ分布(未知の分布)より得られた新しいデータに対して、もっとも信頼性の高い予測結果を与えるモデルを構築することを目的にしている。
|