通常,正常データと異常データを分類する異常検知問題において,正常データに比べて異常データは収集が難しく,不均衡問題となりやすく,そのような問題 においても異常データが多く得られた場合と同様の性能を示すようなアルゴリズムやシステムの構築は本分野においては重要であり,実用的であるといえる. 本研究では,疑似データを生成することによる異常検知性能向上と個人認証システムへの応用を目的とし,① 少数の異常データと多数の正常データを基にし た擬似異常データの生成,② 多数の正常データのみを基にした擬似異常データの生成,③ 少数の正常データを基にした擬似正常データの生成の3つの疑似デー タの生成方法を用いる.令和4年度は,主に②のアルゴリズムの確立と②のシステム構築と実験・考察を行った. 多数の正常データを基にSVDDまたは複合カーネルを用いたSVMにより,外れ値領域を予測し,疑似異常データ生成を行った.実験では,異常検知用画像データを用いており,事前学習としてCNNモデルであるEfficientNetを用いてファインチューニングを行う.ファインチューニングの際,与えられたデータを全て用いると計算コストと検知精度の観点から非効率であることが確認されていたため,SVDDによりあらかじめ決定されたサポートベクトル又はそれら以外のデータのみでファインチューニングを行うことによる汎化能力と計算コストへの影響を確認し,有効性が確認できた.
|