2007 Fiscal Year Annual Research Report
リスク最小化に基づく非凸型識別手法の開発と与信審査・医療診断問題への実証的適用
Project/Area Number |
19710124
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
武田 朗子 Tokyo Institute of Technology, 大学院・情報理工学研究科, 助教 (80361799)
|
Keywords | サポートベクターマシーン / 非凸二次計画問題 / Conditional Value-at-Risk / 汎化誤差 / 局所最適性 |
Research Abstract |
サポートベクターマシーン(Support Vector Machine: SVM)は、あらかじめ分類された訓練データ(ラベル付きデータ)に基づいて分類ルールを学習し、そのルールを適用してテストデータ(ラベル無しデータ)を分類する手法であり、現実の問題への応用において優れた性能を持つことが報告されている。特に、ν-SVM [Scholkopf等, 2000] はパラメータ選択が他のSVMに比べて容易なため、注目を集めている。 本年度の研究では、ν-SVM の拡張モデルとして提案されたExtended ν-SVM [Perez-Cruz等, 2003] の性能評価を行った。 Extended ν-SVMに対して、金融業界でよく知られたリスク尺度 (CVaR: Conditional Value-at-Risk) に基づく新しい解釈を与えた。また、Rockafellar & Uryasev等によるCVaRの理論的研究成果をExtended ν-SVMに適用することにより、Extended ν-SVMの分類性能を評価し、モデルの妥当性を示すことができた。具体的には、Extended ν-SVMの汎化誤差(学習に使わなかったテストデータで推定結果をテストした場合の誤差)の上界式を導出し、Extended ν-SVMによるCVaR最小化がその上界式を最小化する解を与えることを証明した。 Extended ν-SVMは、ν-SVMよりも性能のよい分類器を構築することが示されているが、問題が非凸二次計画問題となるため、扱えるデータ集合の規模は、現時点では実用上十分な大きさに達していない。そこで、既存の反復解法を有限回の反復で終了するように改良し、より規模の大きな問題が解けるようになった。また、アルゴリズムの局所最適性についても示した。
|