多様なデータから多様な効果を推定するための空間回帰モデリング
Project/Area Number |
20K13261
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 04010:Geography-related
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
村上 大輔 統計数理研究所, データ科学研究系, 助教 (20738249)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000)
Fiscal Year 2023: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2022: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2021: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2020: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
|
Keywords | 時空間回帰 / モデル選択 / 空間統計 / 高速化 / 加法モデル / カウントデータ / COVID-19 / 空間回帰 / 加法混合モデル / 非ガウスデータ / 大規模データ / 時空間モデリング |
Outline of Research at the Start |
本研究では、申請者らの独自手法random effects eigenvector spatial filtering(RESF)を拡張することで、多様・大規模な空間データのための空間回帰手法を幅広く開発・整備する。また、標本数が増えても推定の計算量が変わらないというRESFの特性を活かし、データの背後に潜む空間・非空間効果を高速に推定・識別する方法を開発する。開発した手法は統計ソフトRのパッケージ上などで順次公開し、ユーザーからの意見などを参考に更新を重ねることで、地理情報に関連する幅広い研究者・実務者に利用されるパッケージとしていくことを目指す。
|
Outline of Annual Research Achievements |
幅広い時空間データを精度よく回帰するために、以下の課題に取り組んだ:(i)幅広い効果(空間効果、時間効果等)を高速に選択するための時空間回帰の拡張;(ii)ローカルな傾向を捉えるための時空間回帰の拡張。(i)に関しては機械学習手法reluctant interaction modelingの援用により、主効果を選択した後に、交互効果を選択するという2ステップによるモデル選択法を開発した。また、開発手法を既存の高速最尤推定法と組み合わせることで効果選択に要する計算時間を大幅に削減した。シミュレーション実験を通して、提案手法を用いた効果選択により、時空間回帰の精度を計算効率を落とさずに改善できることを確認した。(ii)に関しては、generalized product-of-experts(gPoE)と呼ばれるモデル統合法の援用により、複数の局所時空間回帰を事前に推定し、それらを事後的に統合するという方法を新規開発した。同手法を用いることで、これまで開発してきた時空間回帰の主な問題であった局所傾向を見落とす問題(degeneracy problem)が緩和でき、大幅なモデリング精度の改善を行うことができた。また、既存の時空間回帰を上回る効果の推定精度となったことも確認した。(i)と(ii)で開発した両手法は統計ソフトウェアRのパッケージspmoranに実装するための準備を進めており、間もなく実装予定である。なお、以上で開発した手法は、犯罪、Covid-19、賃料等の分析に応用しており、実用面での有用性も確認できた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究概要で紹介した(i)でのモデル開発は、これまでの空間統計モデルでは同時には扱えなかった多様な効果を考慮した解析を可能とするものであり、実用上きわめて有用な成果と考える。また(ii)のモデル開発もまた、既存の関連手法で深刻な問題とされてきたdegeneracy problemに対する有効な対策を与えるものであり、精度の良い時空間モデリングを行うために重要である。当初、特に(ii)に関しては有効な解決策が開発できる見込みがなかったため、モデル開発に関しては計画以上に進展したと判断した。(i)に関しても本年度以内に成果が出るとは当初考えていなかったため同様に計画以上に進展したと判断した。その一方で、どちらも査読付き論文として採択されるには至っていないため、「おおむね順調に進展している」という判定とした。
|
Strategy for Future Research Activity |
引き続き時空間回帰の高度化を行う。より柔軟なモデル化を行うために、本年度に開発したgeneralized product-of-expertsによるモデル統合についてより深堀したい。具体的には、例えばモデルを幅広く生成し、それらをgPoEで統合することで、複雑な時空間パターンや幅広い効果を捉えることのできる各種のモデリング手法を検討したい。さらに、例えば同モデル統合を100mグリッド別モデルと市区町村別モデルなど空間スケールの異なるモデルの統合など、より実用上役に立つ定式化についても検討した。また、特に次年度は最終年度のため、開発した一通りの手法をフリーの統計ソフトウェアRのパッケージとして実装・公開することで、誰でも利用可能な形に整備していきたい。
|
Report
(3 results)
Research Products
(25 results)