研究課題/領域番号 |
17K12974
|
研究機関 | 統計数理研究所 |
研究代表者 |
村上 大輔 統計数理研究所, データ科学研究系, 助教 (20738249)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 空間統計 / 大規模データ / 高速化 / 空間回帰モデリング |
研究実績の概要 |
本年度、大規模な空間データを取り扱うための回帰モデリング手法の開発と高度化・高速化を行なった。ここでは、データの背後にある空間過程を効率良く次元縮減(近似)する方法の開発と、解析解を持たないパラメータを効率よく推定するアルゴリズムの開発し、それらを組み合わせることで複雑なモデルを大規模な空間データから推定する方法を提案している。同方法は、計算負荷の軽い事前処理を1度行えば、任意のサイズのデータを同一の計算量でモデリング可能という、これまでにない特徴を有する空間回帰モデリング手法となった。また同手法を場所毎に回帰係数を推定する空間可変パラメータモデルに拡張した。既存手法との比較をMonte Carloシミュレーションで行うことにより、提案手法が推定精度・計算時間の双方で既存手法を上回ることを確認した。特に、計算時間の短縮は目覚ましく、計算負荷の観点で実用が困難であった高度な空間回帰モデルの短時間での推定にも成功しいている。なお、データが大きすぎる場合に局所的な空間変動が捉えられなくなるなどの課題も明らかにしている。以上に加え、上記モデリング手法を空間補間に応用する方法も新規開発した。 ここで提案した手法は、統計ソフトRパッケージspmoran内で一般に公開している。さらに、ここで提案した手法を時空間データのためのモデリング手法に拡張した。それにより、提案手法が大規模な時空間データを計算効率よくモデル化する上で有効であることを確認している。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
空間統計モデルの高速化、およびその時空間モデリングへの拡張という、当初の目的を概ね達成することができた。また、それらの成果をまとめた論文2本が、関連分野の主要国際誌(Geographical Analysis、Annals of American Association of Geographers)に掲載決定しているなど、国際的にも評価を得ている(いずれもまだpublishされていないため、本年度の成果にはできない)。また、統計ソフトspmoranへの公開も行うことができた。さらには、一連の研究をきっかけに、空間統計の大家であるDaniel A. Griffith教授(テキサス大学)との研究連携体制がより強固になっただけでなく、Chris Brunsdon教授、Martin Charlton教授(Maynooth University)といった計量地理を長年牽引してきた別グループとの研究連携も開始するなど、予想外の進展もあった。以上より、当初の計画以上に進展していると判断した。
|
今後の研究の推進方策 |
Griffith教授(テキサス大学)はじめ国内外の共同研究者との共同研究体制を深めながら空間統計手法の高度化を進める。特に、時空間の動的モデリングに関しては、当該分野での発展が遅れていることから優先的に進めていきたい。また、当初の計画に沿って、より多種多様な時空間データをモデル化するための方法も幅広に開発しつつ、並行して統計ソフトRによるツール公開を進める。以上を通して、幅広い分野の研究者・実務者に利用されるような、空間統計解析の基盤の開発を徐々に進めていきたい。
|
次年度使用額が生じた理由 |
当初、書籍、計算機などの購入にも当予算をあてる予定であったが、それらが想定よりも安価であったため、別の予算で完全に賄えてしまい結果として次年度使用額が生じた。次年度使用金は、次年度の物品とデータの購入に使用する予定である。
|