本研究では,深層学習が持つ一体化学習(識別器と特徴抽出器を一体化して設計・学習する方法, End-to-End 学習ともいう)という特徴を維持しつつ,深いネットワーク構造を取り払い,浅いネットワーク構造で機械学習を行うことで,学習結果の説明可能性を向上させつつ,再設計の容易な画像認識手法を実現することを目的とする.特に,説明可能性と再設計可能性を向上させるためには,深層学習が実現している深いネットワーク構造による特徴抽出処理(入力データから識別器の識別空間への写像に相当する)を,従来の特徴抽出処理に置換える必要性があると申請者らは考えた.そこで,従来の特徴抽出処理を拡張して,パラメータ化することで学習可能な特徴抽出器を構成し,一体化学習の実現を目指した. 本研究では、カメラの映像から移動物体と背景とを分離する機械学習を対象とした.特徴抽出器として,背景をレイヤとして逐次学習する Layered Adaptive Background Model (LABM)と,カメラの動きに合わせて重みを変化させる識別器とで構成することで,移動するカメラにおいても移動物体を抽出することが可能となるようにした.背景モデルでも特徴抽出器でもあるLABMは,背景を逐次学習し,識別器の判定結果を元に自らの重みを調整することが出来る.LABMの出力は,それぞれ対応するレイヤーとして背景の平均と分散を保持しており,それらの重みつきの線形結合として表すことができた. 本研究により,高い識別性能を実現するための方法論として,深いネットワーク構造だけでなく,再設計可能な浅いネットワーク構造による高い学習容量を持つ識別器と認識性能に寄与する学習可能な特徴抽出器の試作を行った.
|