現象を観察して得られたデータから重回帰分析で回帰モデルを作成する際に、無関係な特徴を削除して必要な特徴だけを回帰モデルに組み入れることを特徴選択と呼ぶ。特徴選択は変数選択とも言われ、古くから統計学における課題であったが、近年のデータサイエンスの流行に伴い改めて重要性が指摘されている。本研究では、特徴選択における二つの重要な問題(正準相関分析における特徴選択問題、高次元空間におけるクラス間の重心間距離最大化問題)に対して、新しい数理モデル化を提案した。これらの問題はその非線形性から、従来のソフトウェアでは解くのが困難だったが、本研究の提案手法により高速に最適な特徴選択が行えるようになった。
|