研究課題/領域番号 |
24700277
|
研究機関 | 大阪大学 |
研究代表者 |
廣瀬 慧 大阪大学, 基礎工学研究科, 助教 (40609806)
|
キーワード | スパース推定 / 因子分析モデル / 非凸ペナルティ / モデル選択 |
研究概要 |
昨年度は因子分析モデルに正則化法を適用し,その理論的な性質について考察した.今年度はこの内容をさらに発展させ,すべての解を効率的に計算するアルゴリズムを構築した.また,そのアルゴリズムを実装するソフトウェアパッケージを公開した. (1) 昨年度提案した因子分析のスパース推定法の計算アルゴリズムを改良した.まず,初期値を適切に設定するよう工夫した.また,EMアルゴリズムの内部のCoordinate Descentアルゴリズムを並列演算した. (2) 提案手法を手書き文字データに適用し,その有効性を検証した.すると,因子負荷量が十分にスパースな場合においても(すなわち,画像が十分に圧縮されていても)画像をきれいに復元できることが分かった. (3) 因子分析の正則化最尤推定値を高速に計算することができるソフトウェアRのパッケージfancを公開した.このパッケージには,あらゆる調整パラメータに対する因子と変数の関係性を可視化することのできる,グラフィカルツールを含む.このツールを用いることにより,分析者が因子を解釈しやすいモデルを探し,対応する適合度を見ることによって適切なモデルを選択するという,これまでなかった新たな解析が可能となった. (4) 因子分析モデルにスパース推定を適用すると,第1因子がすべての変数に影響を与えるという直感に合わない結果が頻繁に得られた.その原因を因子回転の観点から探ったところ,正則化項の性質である,パラメータを正確に0と推定することが原因であることが判明した.また,この問題を解決するには,因子間相関を入れたモデルを用いるか,他の因子回転基準を用いれば良いということも分かった.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
正則化法に基づく因子分析では,新たな方法論を提案しただけでなく,従来の方法論との関係性を理論的に考察し,従来法よりスパースに推定できるという新たな知見を発見した.さらに,実際に高次元データに適用できるよう効率的なアルゴリズムを構築した.この方法論,理論,アルゴリズムを1つの論文としてまとめ,著名な国際ジャーナルに採択された. また,グラフィカルツールを含むソフトウェアfancをWeb上に公開した.できるだけ多くの研究者に使ってもらえるよう,国内外で学会発表し,ソフトウェアパッケージについて詳しく述べた.
|
今後の研究の推進方策 |
因子間相関がある場合,スパース推定がうまく機能しないことを確かめたので,来年度は,因子間相関を考慮したモデリングを構築したい.具体的には,モデルを推定する際,因子負荷量,独自分散とともに因子間相関行列も同時に推定する.因子間相関の推定値は,解析的に求めることが困難であり,不安定になる可能性もある.そこで,ベイズアプローチに基づくモデルの推定を検討する. また,スパース因子分析モデルを拡張した,スパース因子回帰モデリングを提案する.このモデルに対して変数選択を行うために,パラメータ行列の各行をグループと見なし,グループ単位で変数選択を行うスパース推定法を提案する.パラメータを効率的に計算するために,EMアルゴリズムとCoordinate Descentアルゴリズムを組み合わせたアルゴリズムを開発する.
|
次年度の研究費の使用計画 |
高性能な計算機を購入する予定であったが,次年度で発売される計算機のほうがはるかに高性能であることがわかったため,次年度に購入することにした. (1) 統計数理研究所に出張し,スパース推定の研究に関するディスカッションを行う.また,因子間相関を考慮したモデリングや因子回帰モデリングに関する研究内容を国際会議で講演する. (2) 大規模データを扱うための高性能な計算機を購入する. (3) 高次元データ解析手法を構築するための理論とアルゴリズムに関する書籍を購入する.
|