研究課題/領域番号 |
18H00835
|
研究機関 | 金沢大学 |
研究代表者 |
星野 伸明 金沢大学, 経済学経営学系, 教授 (00313627)
|
研究分担者 |
間野 修平 統計数理研究所, 数理・推論研究系, 准教授 (20372948)
入江 薫 東京大学, 大学院経済学研究科(経済学部), 講師 (20789169)
佐井 至道 岡山商科大学, 経済学部, 教授 (30186910)
丸山 祐造 東京大学, 大学院総合文化研究科, 教授 (30304728)
|
研究期間 (年度) |
2018-04-01 – 2023-03-31
|
キーワード | プライバシー |
研究実績の概要 |
本年度は、復元抽出の族であるベル多項式分布について、母数空間の特徴付けを行った。またビッグミクロデータの匿名性評価における典型と予想している疑似多項分布について、情報学的に望ましい性質を持っていることを証明することが出来た。情報学的な情報保護基準である差分プライバシー概念の重要性が増しているので、官庁統計への応用可能性の観点からサーベイを行うなど、研究の重心を差分プライバシー概念に寄せている。 具体的には、差分プライバシーの下、疑似多項分布は既存研究で用いられるサンプリングと異なり、大規模データでもノイズが増加しないという美点を発見した。差分プライバシーの解釈については様々な議論が存在するが、「微分プライバシー」の離散版とみなすのが適切と考える。微分プライバシーは、フィッシャー情報量を限定する十分条件になるので、母数の推定量の分散の下限を定める。従って差分プライバシーについても、センシティブ変数の推定精度の管理基準として理解するのが自然である。この観点からは、定説がない模造データの匿名性評価基準も、統一的に理解可能である。なおベル多項式分布族一般についても、差分プライバシーが成立する条件を明らかにした。この結果の重要な含意は、不等確率の復元抽出によって差分プライベートなミクロデータが公開可能になるということである。 これらの成果については、招待講演等で概要を説明した他、統計実務家も参加可能な公開の研究集会を開催し、周知に努めた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
疑似多項分布の実用において、サンプリングが出来ることは極めて大切である。これを実証したので、疑似多項分布の匿名性管理上のよい性質が空論でないことになる。この疑似多項分布のよい性質は、分布族の性質として一般化して理解する方向の見通しが立っている。また、差分プライバシー概念を官庁統計実務に応用する際に先行研究が課題として指摘している点も、いくつか解決できる見込みである。
|
今後の研究の推進方策 |
先行研究において、官庁統計ならではの差分プライバシーの課題がいくつか指摘されているが、そのうち乗率と度数制約の問題は疑似多項分布を含む分布族について解決のアイデアがある。また差分プライバシーの母数の決め方は、未知属性の推定精度の管理と考えれば自然な方法が導かれると考えている。これらの発想を精緻化する方向で研究を進める。
|