研究課題/領域番号 |
18K01549
|
研究機関 | 法政大学 |
研究代表者 |
森 博美 法政大学, 日本統計研究所, 研究員 (40105854)
|
研究分担者 |
長谷川 普一 新潟大学, 自然科学系, 研究員 (50719680) [辞退]
小池 司朗 国立社会保障・人口問題研究所, 人口構造研究部, 部長 (80415827)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 国勢調査 / 行政情報 / データリンケージ / 人口移動 |
研究実績の概要 |
本研究は、①国勢調査の調査票情報の独自集計等による分析と②公的統計と行政情報とをリンクした統合データの作成及びそれを用いた分析によって人口移動に関する新たな知見の獲得を目的とする。2019年度の研究成果は以下の通りである。 ①に関しては、「居住期間」に関する既存集計の改善につながる研究を行った。居住期間移動と表裏をなすもので常住人口の居住期間分布を示す重要なデータとされている。ただ、既存集計では1年未満から20年以上までの期間5区分に「出生時から」という異質なカテゴリーを並置した6区分で結果表章されている。「出生時から」には様々な居住年数を持つ者が含まれるため、既存集計での期間5区分は常住者の居住期間について現実とは異なる分布情報を提供している。 調査票情報を独自集計し「出生時から」の常住者を5区分の居住期間に再配分することで、地域の常住人口の居住期間に関する正確な分布情報が得られる。森博美・長谷川普一(2019)「人口・世帯属性からみた居住期間分布について」『公的統計情報-その利活用と展望』(中央大学経済研究所研究叢書第75号所収)は、種々の人口・世帯属性別に居住期間に関する既存集計と今回の独自集計結果との異同を比較考察し、既存集計の改善方法を提案したものである。 ②に関しては、国勢調査の調査票情報と行政情報(住民基本台帳登録)のマッチング作業を行った。双方に共通した変数は男女と年齢だけであるため、新潟市域の80万超のレコードをこれらの情報だけで照合することは不可能である。そこで、位置情報を用いて各データセットをセグメント化することでそのマッチングを行った。具体的なアルゴリズムや照合から得られた統合データが持つ年齢等の属性別特徴については、長谷川普一(2019)「境域情報等を用いた公的統計と行政情報のマッチングについて」(同上書所収)として公刊した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
本研究は、①国勢調査の調査票情報の独自集計等による分析と②公的統計と行政情報との統合データの作成並びにそれを用いた分析とから構成される。 これらの分析を行うために本研究では、採択後直ちに移動情報を変数として持つ2000年、2010年、2015年国勢調査の新潟市相当地域分の調査票情報に関して、統計法第33条に基づく利用申請を行った。2018年9月に利用申請が認められたことから、①のための独自集計並びに②のための行政情報(住民基本台帳)とのマッチング作業に取り組んだ。 特に②に関しては、国勢調査と住民基本台帳の個体レコードの場合、両者に共通する変数が男女と年齢に限られることから、今回分析対象とした人口約80万人の新潟市域について、そのままでは照合作業は不可能である。そのため、別途、総務省統計局に対して行った国勢調査の基本単位区の境域データの利用許可を得て位置情報を用いたデータセットのセグメント化を併用することで両者の個体ベースでマッチングを行った。 本研究が課題としていたもののうち①に関しては、2019年度には3年時の国勢調査の調査票情報を用いて居住期間に関する独自集計を行い、既存集計によっては得られない常住者の居住期間分布を得るとともに、世帯・人口属性別に既存集計との異同を確認することで既存集計の改善方向の提案を行った。また、②に関しては位置情報を用いたマッチングによって得られた統合データの属性別特徴などそのデータ特性に関する多面的な評価分析を行った。 ②の結果は、位置情報を用いたリンケージ手法が横断面だけでなく縦断面でのデータ統合(データのパネル化)の方法論としても有効性を持つことを示唆するものである。そこでパネル統合データにまで拡張した分析に取り組むために、国勢調査の調査票情報について改めて2021年3月末までの利用申請を行い、2019年11月にその承認を得た。
|
今後の研究の推進方策 |
2020年度についても国勢調査の調査票情報の使用許可が得られたことから、調査票情報を用いた独自集計等による分析に関しては、次のような諸課題に取り組む予定である。 2019年度の研究によって居住期間の分布情報が得られたことから、それを受けて2020年度には居住期間の規定要因を明らかにしてみたい。居住期間については、「1年未満」、「1-4年」、「5-9年」、「10-19年」、「20年以上」という各カテゴリーが順序統計量としての情報特性を持つ。従って、それらを従属変数とした順序ロジット、あるいは特定のカテゴリーに注目した二項ロジットによる回帰分析を行うことでそれを規定していると思われる要因の抽出を行う。 また、近年、移動に係る調査不詳の急増が移動データを用いた分析の現実的妥当性を危うくしつつある。そのため移動の実態を明らかにする上で、不詳の発生メカニズム等も含めた移動データに関する広範なデータ特性の解明が急務となっている。調査票情報を用いた多面的な独自集計等によってそれを明らかにしたい。 一方、データ統合並びに統合データを用いた分析に関しては、2019年度の作業結果から位置情報を用いたデータ統合に関して、照合率の面でもまたデータ特性の面でもその有効性が確認された。その方法論は異種データ間の横断面のデータ統合だけでなく、一定の条件の下で縦断面でのデータ統合によるパネルデータの構築にも汎用性を持つと考えられる。2020年度についても国勢調査の調査票情報の使用が新たに許可されたことから、他の行政情報との横断面データ統合に加えて複数時点における国勢調査データを用いた縦断面データ統合にも取り組んでみたい。現行の国勢調査の調査票情報には共通の識別コードが設けられていないためID情報を用いたパネルデータの構築ができない。この点からも新たなデータ統合の方法論の構築は大きな意味を持つと考えられる。
|
次年度使用額が生じた理由 |
2019年度3月に予定していた研究発表会が新型コロナ肺炎の蔓延に伴う行動自粛要請により中止された結果、2019年度予算の未使用額が発生した。これについては、2020年度予算とともに研究計画に従った物品の購入並びに学会報告等の研究成果発表のための諸経費に充当する予定である。
|