研究課題/領域番号 |
15K15949
|
研究機関 | 大阪大学 |
研究代表者 |
廣瀬 慧 大阪大学, 基礎工学研究科, 助教 (40609806)
|
研究期間 (年度) |
2015-04-01 – 2019-03-31
|
キーワード | スパース推定 / 因子分析 / 因子回転 / 因子回帰 / グラフィカルモデル |
研究実績の概要 |
本年度は,因子分析における新たな正則化法を提案し,因子回帰モデルへの拡張を試みた.また,グラフィカルモデルにおける新たなスパース正則化法を提案した.具体的には以下のとおりである. (1)lassoに基づく因子分析の正則化法は,最近開発された,高次元データへ適用可能な方法であるが,lassoでは正しく因子を特定できないことが多い.そこで,因子回転と結びつけた正則化法が必要であると考え,因子回転の一般化を試みた.すると,varimaxなどの回転基準をペナルティとしてそのまま適用しても,因子負荷行列を計算することができず,正則化法と因子回転の関係性を考慮した新しいペナルティを作る必要があることがわかった.そこで,varimax回転やquartimin回転を修正した新たな正則化法を考えた. (2)因子分析モデルを拡張させたモデルとして因子回帰モデルがある.これは,複数の説明変数を一つの因子としてまとめ,その因子を使ってダイレクトに回帰を行うという方法である.本研究では,因子回帰モデルにおける正則化法を提案し,その理論的性質を調べた.回帰モデルでは,予測が重要になるが,予測の観点から推定量の性質を調べた文献は申請者の知る限り存在しなかった.そこで,予測の観点から推定量の性質を調べたところ,lassoの推定量のバイアスが予測には大きく影響せず,かつ多重共線性に対処することができるという知見が得られた. (3)ガウシアングラフィカルモデルは,共分散逆行列のスパース性を用いてネットワークを生成するモデルである.現実世界では,スケールフリーネットワークと呼ばれる,「ハブ」を持つネットワークが多いが,このようなネットワークを普通のlassoで推定することは難しい.そこで,ハブを持つ場合にうまく推定できる新たなペナルティを考案した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
これまで,因子回転を拡張した正則化法は提案されておらず,そもそもうまく機能するかどうか,実際に研究にとりかかるまで全く分からなかったが,適切に回転基準を修正すれば正則化法に拡張できることがわかったので,特に大きな問題はなく順調に進んでいると考えている.また,因子回帰モデルにおいても,思った以上に予測の観点から理論的性質を導き出すことができた.グラフィカルモデルに関しては,論文がアクセプトされた.
|
今後の研究の推進方策 |
(1)の因子分析モデルでは,とりあえず定式化はできたものの,推定量の理論的性質の考察やアルゴリズムの考案まで行っていない.そこで,来年度以降は,効率的なアルゴリズムを提案し,さらにlassoと比較してどのような良い性質があるのかを理論的,数値的に検証する必要がある. (2)の因子回帰モデルでは,lassoしか適用を試みていない.そこで,(1)の因子回転を拡張した,因子回帰モデルを考案し,その理論的性質を調べる必要がある.また,因子回帰モデルを拡張した構造方程式モデリングにおける新たな正則化法を提案する.このとき,識別性の問題を正則化法がどこまで対処できるのか,因子回転とlassoはどちらが優れているのかなど,まずは数値的に調べる必要がある. (3)のガウシアングラフィカルモデルは外れ値の影響を受けやすい.そこで,外れ値に影響を受けにくい,ロバストな推定を考える必要がある.過去に提案されているロバスト推定法は,あまりロバストでないということがわかった.そこで,外れ値に影響を受けにくく,かつアルゴリズムを簡単に構築できる方法を提案する.
|
次年度使用額が生じた理由 |
旅費および物品が当初想定していたよりもかからなかったため.
|
次年度使用額の使用計画 |
高性能な計算機を購入する.
|