最終年度では、多量・多次元データの典型例として脳波信号などの時系列情報を対象とし、これらの分類・識別性能向上に資することを最終目標とした上で、入力データの意味的解釈を容易にする因子分解手法の検討を実施した。この検討手法では、時系列情報であること考慮した上で因子の意味的解釈が容易になることは確認できたが、分類・識別性能を劇的に向上するような、教師なし機械学習手法としてのサンプル選択などは困難なままであった。以上の検討は、2022年6月13日に開催された福岡大学数理情報学セミナーにて講演を行なった。 期間全体では、上記と並行して、一般的なFactor analysis (FA)、Semi non-negative matrix factorization (Semi-NMF)に関する検討を進め、最適化において、疎な因子を推定するための正則化項を評価関数に導入した問題を解くことで、例外値となるサンプルの選択が可能となることまでは突き止めた。この際、正則化項は、L0正則化を考慮した定式化とし、Orthogonal matchiing pursuit (OMP)の枠組みで最適問題を解く、またはL1正則化を考慮した評価関数の最適化問題を解くことで実現できそうなことまでは解明できたが、これらの推定結果を用いて、例外値となるサンプル群の定量的な評価基準と、そのサンプル選択結果を用いた学習データセットの再構成による汎化性向上までは解明することができなかった。
|