2016 Fiscal Year Annual Research Report
公的大規模データの利用におけるプライバシー保護の理論と応用
Project/Area Number |
16H02791
|
Research Institution | Okayama Shoka University |
Principal Investigator |
佐井 至道 岡山商科大学, 経済学部, 教授 (30186910)
|
Co-Investigator(Kenkyū-buntansha) |
渋谷 政昭 慶應義塾大学, 理工学部(矢上), 名誉教授 (20146723)
星野 伸明 金沢大学, 経済学経営学系, 教授 (00313627)
間野 修平 統計数理研究所, 数理・推論研究系, 准教授 (20372948)
伊藤 伸介 中央大学, 経済学部, 准教授 (90363316)
稲葉 由之 明星大学, 経済学部, 教授 (80312437)
瀧 敦弘 広島大学, 社会科学研究科, 教授 (40216809)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 官庁統計 / 個票データ / ミクロデータ / リスク評価 / 秘匿措置 / ビッグデータ |
Outline of Annual Research Achievements |
本研究の本年度の主目的は,データに対する秘匿方法とリスク評価方法の理論を確立し充実させることであり,データとしては個票データ,表形式データ,疑似ミクロデータが対象であった。 このうち個票データに対するリスク評価に用いられるピットマンモデルやユーエンスモデルなど確率分割に関する研究やその関連領域における研究では,渋谷,大和,間野などによってモデルの性質などについて多くの成果が得られた。また,汎用的なリスク評価についての提案も星野によってなされた。さらに,伊藤らによって,個票データの有用性とリスクを同時に考慮した評価手法について引き続き検討が進められている。 疑似ミクロデータについては,統計センターにおいて伊藤の提案した方法を取り入れて疑似ミクロデータの提供が行われており,現在も改良が進められている。個票データのいくつかの項目に直接ノイズを加える方法についても伊藤,佐井によって研究が進められ,ノイズの挿入方法などについて基礎が完成しつつある。また,第三者が持つ母集団情報の曖昧さを考慮に入れた疑似ミクロデータのリスク評価方法についても佐井によって提案がなされた。さらに,個票データ,疑似ミクロデータ,オンラインでの公開方法などに関する諸外国の現状についても幅広く情報が集められた。 本研究のもう一つの目的は,種々の分野のビッグデータの公開に関する研究を行うことであった。情報処理学会内のPWS(プライバシーワークショップ)とはそれぞれの研究集会へ相互に参加するなど頻繁に交流が行われ,それぞれの成果を研究に取り入れつつある。 本研究の成果については,2016年9月に行われた統計関連学会連合大会などの学会や国内外の各種シンポジウム,研究集会において報告を行うとともに,2016年12月8日,9日に統計数理研究所で主催した研究集会や研究会でも報告し,討論や意見交換を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
個票データの寸法指標を用いたリスク評価に用いられるモデルや分布に関する性質や,モデルを用いた推定の性質,その関連分野における研究では,本年度当初の予定どおり,あるいはそれ以上に進捗が図られた。この部分は本研究グループの貢献が最も大きい部分であり,諸外国の研究をも凌いでいる。また,汎用的なリスク評価についてはこれまで欧米では検討されてきたものの,国内での検討は十分行われてきておらず,本年度特に大きく進捗した部分である。さらに,個票データの有用性とリスクの同時評価は,当初の予定どおり継続的に研究が進められているが,残されている課題も多くさらなる検討が必要である。 表形式データに関しては,各国のセンサスのデータを提供しているIPUMSの現状調査や,欧米で伝統的に用いられているシステムであるτ-Argusに関する調査が進められたが,まだ成果として目立ったものはない。 疑似ミクロデータについては,いわば嘘をつくデータを提供しないという官庁の方針もあり,これまで国内では積極的な研究が行われてこなかったが,ここ数年,研究が活発になっており,本年度,本研究グループで進捗が最も大きかった部分の一つとなった。特に理論的な研究に取り組む研究は国内では少なく,貢献は大きいと考えられる。 種々の分野のビッグデータの公開に関する研究を行うことも主目的の一つであり,当初は医学統計,生物統計,空間統計などが候補に挙がっていたが,データの使用に関する制約もあり空間統計以外での進捗は大きくなかった。その一方でPWSとは想定を大きく超える交流が行われたこともあり,PPDM(プライバシー保護データマイニング)などにおいては研究の進捗が図られた。 以上,研究目的の個々の項目における進捗状況には一長一短があるが,総合的に考えるとほぼ当初の計画どおりの研究が行われたと考えられる。
|
Strategy for Future Research Activity |
ピットマンモデル,ユーエンスモデルなど,個票データのリスク評価に用いられる確率分割の種々の性質やデータへの応用の研究は,本研究の中心であり,しかも他に類を見ない研究も多くあり,来年度以降もさらに研究を進めて充実した成果を上げていきたい。個票データの有用性とリスクとの関係についての研究は軌道には乗っているものの,例えばPWSなどで用いられている手法なども考慮に入れるなどして,さらに汎用的な手法を開発したい。 表形式データの秘匿方法などの研究では,マルコフ基底を利用する研究以外では,新たな理論的な貢献の実現ができておらず,切り口を整理するなどして研究の糸口を見つけたい。 疑似ミクロデータについては,ミクロアグリゲーションやノイズの挿入を中心に秘匿方法とリスク評価の検討が行われてきたが,後者についてはまだ典型的な分布を用いた理論的な研究にとどまっており,これまで得られた理論の一般化と,実データへの適用についてさらに検討を行いたい。またスワッピングなど他の秘匿措置についても検討を行っていきたい。 PWS(プライバシーワークショップ)との連携はさらに進めていきたい。来年度は,9月の統計関連学会連合大会におけるPWSと連携した企画セッションや,10月のPWS2017における統計関連の特別セッションなどが計画されている。これらの機会を活かして,PWSのこれまでの成果を本研究に取り入れるなど,新たなステップアップを行いたい。 昨年度と同様に,個々のテーマごとに小研究会を数回開催するとともに,2017年12月には統計数理研究所で2日間にわたる研究集会を予定しており,官庁,企業などの実務者にも参加を促し,それらの意見も取り入れた研究を進めていく。また,本研究の成果については統計関連学会連合大会を初めとする国内外の学会やシンポジウムで公表する。
|
Research Products
(78 results)