2020 Fiscal Year Annual Research Report
政府統計ミクロデータの構造化と研究利用プラットフォームの形成
Project/Area Number |
16H02013
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
椿 広計 統計数理研究所, 大学共同利用機関等の部局等, 名誉教授 (30155436)
|
Co-Investigator(Kenkyū-buntansha) |
山下 智志 統計数理研究所, データ科学研究系, 教授 (50244108)
南 和宏 統計数理研究所, データ科学研究系, 教授 (10579410)
田中 雅行 一橋大学, 経済研究所, 准教授 (00843773)
美添 泰人 公益財団法人統計情報研究開発センター, その他部局等, 客員上席研究員 (80062868)
星野 崇宏 慶應義塾大学, 経済学部(三田), 教授 (20390586)
佐野 夏樹 東京情報大学, 総合情報学部, 准教授 (60568971)
岡本 基 統計数理研究所, 運営企画本部, URA (90599870)
久保田 貴文 多摩大学, 経営情報学部, 准教授 (30379705)
稲垣 佑典 統計数理研究所, データ科学研究系, 客員准教授 (30734503)
|
Project Period (FY) |
2016-04-01 – 2021-03-31
|
Keywords | 経済統計学 / 統計制度 / データ利活用 |
Outline of Annual Research Achievements |
プラットフォーム設計ユニットは、オンサイト利用環境整備を進めるとともに、公的統計ミクロデータ研究コンソーシアムの運営を主導した。また、オンサイト利用における持ち出し審査を支援する秘匿処理ツールの利便性、安全性向上のための機能拡張、局所差分プライバシーを欠損値を含むミクロデータに適用した場合のロジステック回帰分析におけるミニマックス・エラーの理論的解析を実施した。併せて、(独)統計センターの研究協力者とともに、外れ値を含む公的統計データにおけるエディットの補完技術としての推定技法について、ロバスト推定の観点からの研究を実施した。 データ構造化ユニットは、データの相関構造を保存した合成データ生成手法として、主成分分析に基づく手法を提案した。さらに、砂時計型ニューラルネットワークと呼ばれる入力層における入力変数と出力層における教師変数を同一にした多層構造のネットワークを用いることで、非線形な主成分分析による合成データを生成した。これらの手法の有用性を原データと生成データの間で、平均2乗誤差などの指標を計算し、評価した。 データ活用・効率化ユニットは、オックスフォード大学との社会生活基本調査の調査票情報を利用したジェンダーギャップ、ミネソタ大学人口センターとの分類項目が異なるデータの結合やメタ情報の付与についての国際共同研究を実施したほか、和歌山県の行政データの匿名化に関するガイドラインの作成や行政データを用いたSynthtic Microdata作成を支援した。また、Web調査に関する研究を進め、調査票に(心理)実験的な仕組み、パラデータと呼ばれる調査自体についてのデータを取得するの仕組み等を導入したWeb調査の実施方法やデータ分析の結果を公表した。その他、古典的統計学の枠組みを活かしたデータサイエンス教育、特に大学教育の在り方などについても調査・研究・内閣府の委員会等にて提言した。
|
Research Progress Status |
令和2年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和2年度が最終年度であるため、記入しない。
|
Research Products
(49 results)