研究実績の概要 |
本研究の目的は, 離散的な変化係数モデルを用いた新たな空間データの分析手法を開発することである. 従来の連続的な変化係数モデルではデータの観測点 (緯度・経度) により空間の情報をモデルに組み込んでいたが, これにより生じる欠点を改善するため, 本研究では観測点を用いず, 解析対象の空間を分割することで得られる小空間の隣接関係を利用した推定法を提案する. 具体的には小空間ごとにモデルを定義し, その隣接関係に基づいてGeneralized Group Fused Lasso (GGFL) により空間効果の等しいモデルを結合するという手法である. そのために, 本年度はまずGGFLの最適化問題を効率的に解くための座標降下法の開発に着手した. GGFLの目的関数は複数の微分不可点を持つことからその最適化は複雑になるが, 劣微分を用いて微分不可点で最小となる条件を導出した. またその条件を満たさないときの解の更新方法も導出し, この更新により得られる解が最適解に収束することを理論的に証明した. さらに開発したアルゴリズムが数値的に上手く働くことを確認した. 具体的には, 真の小空間の結合を高い確率で選択できることが分かり, 標本数を大きくするとその選択確率が1に近づく一致性のような性質を確認した. また, 近年よく用いられる交互方向乗数法と比較し, 開発したアルゴリズムの計算時間が圧倒的に速いという結果を得た. さらに開発したアルゴリズムでは解を正確に結合できるのに対して, 交互方向乗数法では正確な結合ができないことも分かった. 実データ解析において, 大標本の不動産データに対して従来法である地理的加重回帰との比較も行い, 当てはまりや予測精度はやや劣るものの, 計算時間が圧倒的に速いという結果が得られた. 以上の成果は論文にまとめ, 現在学術雑誌に投稿中である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究を成功させるための課題は大きく分けて2つある. 1つ目は最適化アルゴリズムの開発および性能の評価であり, 2つ目は空間データに対する推定精度・予測性能の評価である. 研究初年度である本年度は1つ目の課題に関して主に最適化アルゴリズムの開発に着手した. アルゴリズムを開発し, 解が最適解に収束することを理論的に証明することができた. さらに数値実験や実データ解析により開発したアルゴリズムの性能も評価することができたため, 1つ目の課題を概ね達成できたと考え, このように評価した.
|
今後の研究の推進方策 |
本年度の成果で本研究を成功させるための最適化アルゴリズムは開発することができたと言えるため, 今後は次の段階に進む. 本研究の目的は空間データの分析手法を開発することであるため, 提案するモデルが空間データのモデリングに適しているかどうかを評価する. 具体的には, 実際の空間データに即した設定の下で数値実験を行い空間データに対する性能を評価する. また, 本研究課題の申請時にはなかった新たな手法も開発されているため, 他の従来法も含め, これらの手法との比較を行う. さらに, 提案する手法の汎用性を高めるため, 一般化線形モデルなどへのモデルの拡張や統計解析ソフトRなどのパッケージの作成も行う.
|