研究概要 |
多変量データ解析において,データ次元を縮約する標準的な方法に主成分分析がある.この方法は,計量データを対象にしており,データに非計量データが含まれる場合,何らかの方法で数量化する必要がある.これをおこなう方法の1つに交互最小二乗法がある.この方法は,最小二乗推定をブロック化したパラメータに対して適用することで非計量データの数量化をおこなうものである.ただし,反復法のベースとなるのが最小二乗推定であるため,計量データと非計量データの混在した大規模データの適用において交互最小二乗法が収束するためには非常に多くの反復回数が必要となり,それに伴いこの計算に要する時間も長大になる. そこで,交互最小二乗法で生成されるパラメータの推定列の収束を加速し,反復回数及び計算時間を短縮するための加速法を提案した.ここで提案した加速法は,我々がEMアルゴリズムの加速で用いたベクターエプシロン法によるものである.ただし,尺度混在した観測データを主成分分析した場合,交互最小二乗法で推定するパラメータは複数存在するため,加速するパラメータを決定する必要があった.この点が,EMアルゴリズムでの定式化と異なり,ベクターイプシロン法の特性と合わせてこれを考える必要があった.乱数データによるシミュレーション実験で従来の交互最小二乗法と提案した加速化法の比較をおこなった結果,提案した加速化法は2倍から4倍の反復回数および計算時間の短縮することができた。そして,2つのアルゴリズムの生成される推定値の収束先(停留点)も同じであることも確認した.この結果は,提案した加速化法が優れた性能を有している事を実証するものであると考える. この研究で得られた成果は,Computational Statistics & Data Analysisに掲載された.
|