2022 Fiscal Year Annual Research Report
高次元データを含む不均衡データを用いた回帰問題のためのデータバランシング手法
Project/Area Number |
21K21297
|
Research Institution | Kyoto Tachibana University |
Principal Investigator |
吉川 寛樹 京都橘大学, 工学部, 助教R (10905350)
|
Project Period (FY) |
2021-08-30 – 2023-03-31
|
Keywords | 機械学習 / 不均衡データ / 生成モデル / データバランシング / 損失関数 |
Outline of Annual Research Achievements |
機械学習により構築した推定器の出力の偏りや不均衡を解決することを目的として、研究を行った。 1つ目の研究成果として、回帰問題での不均衡データセットへの対応として、新たな損失関数の提案を行った。特に、サンプル数が少ないマイノリティデータの取り扱いを改善することで、機械学習による推定器の性能を向上させることを確認した。 2つ目の研究成果として、生体データを用いた心理・生理状態の推定を対象に、データ分布の偏りを緩和するためのデータバランシング手法の一つであるSMOTEを改良したデータ拡張手法を提案し、推定値の偏りが軽減されることを確認した。 3つ目の研究成果として、人間の温冷感の動的な推定に関して、新たな深層学習ベースの手法を提案した。これにより、人間の移動や空気の流れの変化など、データセットには多く含まれない動的な環境下での熱感覚をより正確に推定する手法を提案した。 4つ目の研究成果として、温熱快適性データセットの不均衡性問題を解決するための新たなデータバランシング手法を提案した。重み付き損失関数を用いた敵対生成ネットワークを通じて、データの不均衡を軽減しつつ、推定器の性能を向上させることを確認した。 5つ目の研究成果として、人の温冷感データセットのプライバシー保護とデータ拡張を目的として、変分オートエンコーダを用いた手法を提案した。これにより、データから被験者IDを推定可能な情報を削減しながらデータ拡張を行い、推定器の訓練に有益な匿名化されたデータセットを生成することを確認した。
|