研究概要 |
本研究では,外的変量のない多変量解析のうち,対象を主成分分析に絞り,主として次の課題に重点的に取り組んだ。 1.これまでの変数選択手法の整備 2.主成分分析における変数選択手法の評価と選択変数数の特定 3.新しい選択規準の検討 4.主成分分析における変数選択プログラムの開発(Windows版とWeb版) 1.では,文献等の調査から変数選択手法を整理し,新しい選択手法も含めて,11種類にまとめた。これらのうち,Tanaka & Mori の手法(拡張主成分分析)について,4つの選択手順の性能を数値的に比較したり,2つの選択規準(寄与率PとRV係数)について詳細に検討して,手法の充実を図った。 また,2.では,Bootstrap リサンプリングによる手法の評価と,Cross validation による予測残差(PRESS) の値の変化から Reasonable な変数の数の特定を試みた。 3では,新しい規準として,感度分析のアイデアを利用した。感度分析については,その理論と共に,単独で影響の大きい観測値だけでなく複数個の観測値の影響も容易に評価できる総合ソフトウェア SAMMIF の開発も行った。この感度分析の考えを利用し,主成分分析の解析結果あるいは推定するパラメータへの各変数の影響を調べ,それらへの影響が最も小さい変数を削除する変数選択手法を提唱し,新しい規準として十分可能性をもつことを明らかにした。 以上の研究と共に,4.として,主成分分析における変数選択ソフトウェア VASPCA を開発した。上にあげた主成分分析における変数選択手法の全てが実行できるインタラクティブなソフトウェアで,Windows 版の VASPCA/Win と Web上で動作する VASPCA/Web の2バージョンがあり,総合ソフトウェアとして機能している。
|