研究課題/領域番号 |
20K13261
|
研究機関 | 統計数理研究所 |
研究代表者 |
村上 大輔 統計数理研究所, データ科学研究系, 助教 (20738249)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
キーワード | 空間回帰 / 加法混合モデル / 非ガウスデータ / 大規模データ |
研究実績の概要 |
本年度は、多様な地理空間データを柔軟にモデリングするための新たな回帰法を、加法混合モデルとCompositionally-warped Gaussian processを融合することで開発した。開発モデル(Compositionally-warped additive mixed model:CAMM)は次の特性を有する:(i)非線形変換を繰り返すことで、正規分布や指数分布といった確率分布を明示的に仮定することなしに、データ分布が自動推定できる;(ii)空間効果や時間効果といった幅広い効果が推定できる;(iii)高速なモデル推定が可能であり大規模データにも適用可能。以上のように、多用かつ大規模なデータに応用可能な新たな回帰法が開発できた。その推定精度はMonte Carloシミュレーションを通して確認済みである。また、その実問題に対する有用性は、犯罪データならびにCOVID-19データへの応用を通して確認した。例えばCOVID-19データへの応用では「第一波では主要都市圏における労働世代、第二波では20代男女、第三波では全国の労働世代へと感染が広がっていった傾向があること」や「人口密度を一定以下に下げない限り、混雑緩和による感染者減少は期待できず、強制力のある政策が必要なこと」など、対策の検討に資する知見が多数得られた。最後に開発した手法は統計ソフトウェアRのパッケージspmoranに実装した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
多様かつ大規模なデータを柔軟にモデル化するための手法開発が目標であったが、「正規分布や指数分布といった確率分布を明示的に仮定することなしに、データ分布が自動推定できる」というこれまでになく多様なデータに適用可能な新たなフレームワークが提案できた。それだけでなく、その大規模データへの適用のための高速化やパッケージ化も完了したため、当初の研究目的がほぼ達成されたと言える。従って当初の計画以上に進展していると判断した。
|
今後の研究の推進方策 |
幅広いデータへの応用が可能な手法は提案できたものの、その精度にはまだまだ改善の余地がある。特に現在の方法だと、滑らかに変化する現象しか捉えられないという課題が残されている。従って、急激な変化も捉えられるような高度化が必要である。また動的な時空間変動が捉えられないという点もまた課題であり、改善が必要である。以上に加え、提案手法の有用性や限界を確認するための幅広い実証研究ならびにシミュレーション実験が必要である。
|