2002 Fiscal Year Annual Research Report
層別逆回帰法を用いた説明変量空間の次元縮小に関する研究
Project/Area Number |
14658081
|
Research Institution | Hokkaido University |
Principal Investigator |
水田 正弘 北海道大学, 情報メディア教育研究総合センター, 教授 (70174026)
|
Keywords | 非線形回帰 / 射影追跡法 / 説明変量選択 / 独立成分分析 / 計算機指向手法 / 分布間の距離 / 分布に依存しない手法 / 射影指標 |
Research Abstract |
データの説明変数が多い場合、重回帰分析によって適切な解析結果を得るためには、多くのサンプルが必要であったり、共線性の有無を慎重に検討しなくてはならない。そのために、従来から説明変数選択法が提案されている。しかし、大部分の説明変数が目的変数にある程度関係しているときには、単なる変数選択では適切な結果を得ることは困難である。そこで、ACEや射影追跡回帰のように、説明変数の一次結合により、目的変数を表現しようとする方法が提案された。これらの手法は、特定の回帰モデルを仮定したものである。それらに対して、Li, K. C. (1991 ; JASA)は非常に一般的な回帰モデルの仮定のもとに説明変数の次元を縮小する層別逆回帰法を提案した。しかし、Liが提案した層別逆回帰法のアルゴリズム、さらに他の研究者により提案されたアルゴリズムでは、非常に単純な人工データについても適切な結果を得ることが困難であった。それに対し、研究代表者は、層別逆回帰法に射影追跡を適用することに着目した。これにより、従来の層別逆回帰法では適切な結果を得られないデータについても適切な結果を得ることが可能な方法を構築することができた。 本年度は、層別逆回帰法に射影追跡を利用する方法の実用化と理論構築を目指した。具体的成果として、以下の3つがあげられる。 (1)ある種の条件付分布を導出することにより、層別逆回帰モデルにおける基礎的理論を構築した。 (2)相対射影追跡法を提案し、層別逆回帰における制約条件を除去した。 (3)独立成分分析の適用を試みた。
|
Research Products
(6 results)
-
[Publications] 南 弘征, 水田正弘: "仮想並列計算機によるデータ解析の実行時間に関する考察"計算機統計学. 14・2. 111-122 (2002)
-
[Publications] M.Mizuta: "An Extended Sliced Inverse Regression"C.Warren Neel Conference on Statistical Data Mining and Knowledge Discovery. 29 (2002)
-
[Publications] M.Mizuta: "Relative Projection Pursuit"Data Analysis, Classification, and Related Methods. 131 (2002)
-
[Publications] A.Ohgiya, Y.Komiya, H.Minami, M.Mizuta: "Search for the effective dimension reduction directions in Sliced Inverse Regression model with ICA"Proceedings of the 4th Conference of the Asian Regional Section of the International Association for Statistical Computing. 5-8 (2002)
-
[Publications] Y.Sato, H.Minami, M.Mizuta: "Analysis of spam mail based on email contents"Proceedings of the 4th Conference of the Asian Regional Section of the International Association for Statistical Computing. 12-14 (2002)
-
[Publications] S.Hiro, Y.Komiya, M.Mizuta: "Relative Projection Pursuit with an Extension of Friedman Index"Proceedings of the 4th Conference of the Asian Regional Section of the International Association for Statistical Computing. 238-241 (2002)