現代の大規模データ解析において、少数のパラメータで記述される古典的な統計モデルは上手く当てはまらず、一方で柔軟な表現力を持つパラメータ数の大きいモデルではパラメータ推定や分布予測において安定性に欠けることがしばしばである。パラメータ数が大きいモデルにおいて、非零の値が推定されるパラメータが自動的に疎になるようデザインされた、LASSO に代表される統計手法はこの問題を解決する手段として近年非常に盛んに研究されてきた。本研究ではこの分野において通常仮定されてきた、データの独立同分布性、また目的関数の凸性などの条件を緩めた状況で、推定量の漸近挙動や、有限標本での推定誤差限界を理論的に解析した。時系列モデルを含む一般的な統計モデルに対して、凸でないスパース推定量の解析において、推定誤差限界の評価などいくつかの重要な成果を得た。凸性はスパース推定のこれまでの理論研究において本質的な仮定であり、線形回帰モデルを超えた複雑なモデルの解析を阻む制約条件であった。例えば擬似尤度関数は一般にパラメータの凸関数ではないため、擬似尤度関数に罰則項を導入して得られるスパース推定量の挙動は既存研究の手法では捉えられない。本研究では集中不等式に着目した評価により、凸でない推定関数を扱う一般的な枠組みの構築に成功した。また実データによる予測力の評価、シミュレーションによる検証を通して提案手法の有用性を明らかにした。
|