研究課題/領域番号 |
22300064
|
研究機関 | 同志社大学 |
研究代表者 |
片桐 滋 同志社大学, 理工学部, 教授 (40396114)
|
研究分担者 |
渡辺 秀行 (独)情報通信研究機構, 知識創成コミュニケーション研究センター, 専攻研究員 (40395091)
中村 篤 日本電信電話(株)NTTコミュニケーション科学基礎研究所, メディア情報研究部, 主幹研究員 (50396206)
渡部 晋治 日本電信電話(株)NTTコミュニケーション科学基礎研究所, メディア情報研究部, 研究員 (50396214)
|
キーワード | パターン認識 / 識別学習 / 最小分類誤り学習 / 計算論的学習理論 / 音声情報処理 |
研究概要 |
最小分類誤り(MCE : Minimum Classification Error)学習法の性能限界の追及を目指し、大幾何マージンMCE(LGM-MCE : Large Geometric Margin MCE)学習法や増加型MCE(IMCE : Incremental MCE)学習法の体系的な性能調査を行い、いずれも論文誌論文として掲載されるに至った。その結果、ブースティングやサポートベクトルマシンなどの他の識別学習法とMCE学習との関係を明示することができ、特に本研究で新たに開発したLGM-MCEなどの新しいMCE学習は、小さなクラスモデルで高い識別力を達成する点で他の識別的学習法に対して明確な優位性を持つことを示すことができた。 MCE学習の識別力の鍵を握る平滑化分類誤り数損失の平滑度自動設定法に関しても、その有効性の検証をほぼ終え、当該分野における最難関国際会議で発表するに至った。また、その結果を利用して、仮想標本に基づく未知標本耐性向上のメカニズムを明らかにすることに成功した。特に、一次元の誤分類尺度上における仮想標本の生成を通して(任意の次元数の)多次元標本空間内における仮想標本の生成を制御できることを明らかにした意義は大きい。未知標本耐性に関する今後の研究の強力な道具足り得るものと考えている。 大域的最小状態のみを持つ損失を用いたラウンドロビンデュエル識別法に関しても、最難関論文誌に採録が決まる(未発行のため下記には記載していない)など、その成果のとりまとめを順調に行うことができた。 LGM-MCE学習はまた、非線形カーネルを用いる特徴空間の写像機能を組み込むことで、カーネルMCE(KMCE : Kernel MCE)学習に拡張することができた。予備的実験の結果、本手法はLGM-MCE学習などの先行するMCE法をさらに超える高い識別力を有することが明らかとなっている。 以上のように、本プロジェクト当初に解明を期したMCE学習の性能上限は、着実に極められつつあると考えている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
MCE学習の性能限界を探るためには、その識別力を決定する重要な要素である分類誤り数損失平滑度の合理的な設定法の確立が必要であった。これまでの研究を通して、この課題に対する明確な答え(損失自動決定法)を呈示することが出来、かつそこから派生した、仮想標本に基づく未知標本耐性向上メカニズムの解明も進み、さらにそのメカニズムがオリジナルの標本空間のみならず非線形写像された高次元空間においても成立することさえ明らかにすることができた。損失最小化手続きの性能向上の研究など、挑戦すべき課題はあるものの、現実において到達できる性能限界には既にかなり近づいていると考えている。
|
今後の研究の推進方策 |
明らかにした仮想標本生成メカニズムの解析をさらに進め、仮想標本に関する自然で合理的な仮説の下で到達できる未知標本耐性の限界を探る。固定次元ベクトルパターンに関しては、この問題に対する解が比較的現実的な困難さの範囲に存在するように思われる。しかし、可変長パターンに関する解を求めることは極めて難しく、この点が今後の重要な課題となってくる。 KMCE学習の定形化など、MCE学習に高次元空間への特徴変換機構を組み込むことに成功したものの、そうした単純な特徴変換が最良である保証はない。MCE学習が元々持っている識別的な特徴抽出の考え方に再注目し、与えられるパターン標本の表現法そのものを最適化する手法の検討を付け加える予定である。 ベイズ法とMCE学習との融合等でクラスモデルの最適選択を行うことを考えてきたが、MCE学習の枠組み内においてもモデル選択を行うことができる発想を得ており、この点も今後の課題として追求する予定である。
|