研究実績の概要 |
多値判別問題は機械学習における重要な問題の一つであるが, 対象とするクラス数が大きくなると計算量が増大するという問題点を抱えている. そこで比較的簡単に構成することができる2値判別器を複数組み合わせることで多値判別器を構成するアンサンブル学習に基づくアプローチが採用されることが多い. 本研究では, 一般化ダイバージェンスを用いて2値判別器から構成される非確率モデルを統合するためのアンサンブル手法を提案し, その理論的性質についての考察を行った. 一般化ダイバージェンスの採用により, 多くの既存の2値判別器統合法を統一的に扱うことが可能となった. また, 多くの既存の2値判別器統合法は多値ロジスティックモデルに特殊な制約を課したケースに該当することが明らかとなった.
高次元離散空間上の確率モデルに対する最尤推定量は一般には陽に求まらない. その一方で, 高次元離散空間では確率モデルであることを要請するための正規化項の計算にしばしば指数オーダーの計算量が必要となる. 本研究では, 正規化されていない非確率モデル(拡張モデル)を用いるアプローチを採用した. 前年度までの結果から, 拡張モデルと経験分布を結ぶe-測地線に対応するような局所化モデルを考えることで, 漸近有効性などの好ましい性質を持つ推定量を構成可能であることがわかっていた. そこで, より一般化したu-測地線を考案し, u-測地線による局所化モデルを用いた推定量についての解析を行った結果, e-測地線を用いた場合と同様に漸近有効性が保たれていることが明らかとなった.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
多値判別問題を対象として, 一般化ダイバージェンスを用いて, 多くの既存法を特殊ケースとして含むような2値判別器を統合するための方法論を提案した.
非確率モデルおよび一般化ダイバージェンスを組み合わせることにより, 正規化項の計算を省略することによる計算量的な利点を保ったまま, 漸近有効性などの好ましい統計的性質を持つ推定量が構成可能であることが判明した.
|