研究開始時の研究の概要 |
本研究では, 統計科学において使用される統計モデルを統計力学的手法を用いて解析する. 特に統計モデルの相転移に関する性質を, 物理学の観点から解明する. このような解析を通して, 実データのモデリングやデータ解析において, 相転移点近傍においても安定した推論や情報抽出を行うための知見を提供することを目標とする.
|
研究実績の概要 |
2021, 2022年度に引き続き, スパース推定の枠組みである Sparse Bayesian Learning (SBL) を利用した線形回帰モデルとそれに関連するモデルの性質を研究した. これまでに推定性能のデータ数依存性と事前分布に含まれるハイパーパラメーター依存性を漸近的に解析していた. 前年度は後者の依存性に関して, 一部のハイパーパラメーター領域で解析ができなかった. これは解析途中で直面する数値積分の困難に起因する. 2023年度は数値積分の改良を行い, より広範なハイパーパラメーター領域において推定性能を解析した. またSBLと類似の事前分布の構造をもつ variance gamma 事前分布を用いた場合の推定性能も解析した. 両者の事前分布には分布の伸縮を表すスケールパラメーターが含まれる. 両者の手法に関して推定性能のスケールパラメーター依存性を比較した. その結果 variance gamma 分布はSBLよりも推定誤差を下げられる場合があることを確認した. 研究期間全体を通じて, 統計力学的手法を用いて物理学の観点からSBLとその周辺のモデルを研究した. 得られた結果は推定性能などの性質と, (非線形)回帰分析に関するものに分けられる. 前者ではSBLの推定性能に関してデータ数とハイパーパラメーター依存性を漸近的に調べた. 推定誤差を小さくできる領域とできない領域が分かれており, 各領域内で推定誤差は頑強な傾向があることを確認した. また variance gamma 事前分布はSBLよりも推定誤差を小さくできる場合がある. 回帰分析ではSBLに関連する variance gamma 事前分布, 平均場近似, モデル選択を用いて, 推定するパラメーター数がデータ数より多い状況において過学習を回避する手法を提案した.
|