研究課題/領域番号 |
19K23243
|
研究種目 |
研究活動スタート支援
|
配分区分 | 基金 |
審査区分 |
0107:経済学、経営学およびその関連分野
|
研究機関 | 一橋大学 (2022-2023) 明治大学 (2020-2021) 国立研究開発法人理化学研究所 (2019) |
研究代表者 |
城田 慎一郎 一橋大学, 大学院ソーシャル・データサイエンス研究科, 准教授 (90845918)
|
研究期間 (年度) |
2019-08-30 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2019年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | データ合成 / 空間統計 / ガウス過程 / 空間点過程 / GPSデータ / 匿名化 / 点過程 |
研究開始時の研究の概要 |
近年、経済・経営・医療へのビッグデータ応用が注目を集めている。中でも、GPSデータは個人の住所だけでなく、日中の行動パターンに関する様々な情報を含んでいる。たとえば、マーケティングなどの分野においては、GPSの位置情報を用いて、スーパーマーケットにおける競合他社の購買行動の予測などを行っている。一方で、その情報量から、GPSデータをそのまま開示することは、本人特定化のリスクの観点から非常に危険であり、何らかの処理が必要となる。本研究では、GPSデータに付随する各種大規模な個票データの公開リスクに関する統計的な新手法を提案することを目的としている。
|
研究成果の概要 |
位置情報の社会科学への応用を考える際には、位置情報に紐づいた各個人情報とセットで提供することが重要であるが、個人特定リスクが内在する。個人情報の中でも、とりわけ位置情報は特定化リスクが高い。データ合成手法は、各変数の依存構造を保持したまま、対象となるデータ自体をシミュレートすることで、データの分布構造を保持した上での擬似データにより元データを代替するものである。本研究では、既存研究より柔軟性の高いアプローチとしてガウス過程を用いたデータ合成手法の開発を行った。これにより、個人特定化リスクを抑えたまま変数間の依存構造を保持したデータ合成手法の発展に貢献している。
|
研究成果の学術的意義や社会的意義 |
位置情報の社会科学への応用を考える際には、位置情報に紐づいた各個人情報とセットで提供することが重要であるが、個人特定リスクが内在する。個人情報の中でも、とりわけ位置情報は特定化リスクが高い。データ合成手法は、各変数の依存構造を保持したまま、対象となるデータ自体をシミュレートすることで、データの分布構造を保持した上での擬似データにより元データを代替するものである。本研究では、既存研究より柔軟性の高いアプローチとしてガウス過程を用いたデータ合成手法の開発を行った。これにより、個人特定化リスクを抑えたまま変数間の依存構造を保持したデータ合成手法の発展に貢献している。
|