実施者らは,過去の研究において,回帰モデルに基づく多重代入法のアルゴリズムと位置づけられる空間MCMC法による欠損値補完手法を提案した.土木計画分野で用いられることの多いデータ,例えば不動産データには,「距離の近いデータが似たような傾向を示す」という空間(的自己)相関と呼ばれる性質があり,空間MCMC法では,この特性が明示的に考慮されている. 一方で,これらの過去の研究では,被説明変数yの空間相関のみが考慮され,説明変数Xの欠損復元においては,既往の多くの手法同様,変数間の相関情報のみを利用していた.すなわち,地点iにおけるある説明変数x1iが欠損しているとき,x1iを,別の変数x2iとの相関情報を用いて復元するアプローチである.しかし,欠損値にも,空間相関が存在する場合が多いと考えられ,これを明示的に考慮することで欠損値補完の精度を向上させられる場合も多いと考えられる. そこで本年度は,別の地点jにおけるx1jの情報を用いて,x1iの予測値の確率分布(予測分布)を取得し,それをx1i復元のための事前情報として利用し,変数間の相関情報と組み合わせてx1iを復元するモデルの開発を試みた.本年度は,本課題の基礎となるモデル開発を行い,中規模(約600観測点)の不動産のデータセットを実験対象とし,どのような変数の復元において,空間相関情報が有用になるかを定量的に明らかにした.その結果,特に,x1iと別の変数x2iの相関が非常に弱い場合や,空間相関の強い変数の補完において,本手法が有効に作用することが示唆された.
|