2017 Fiscal Year Annual Research Report
公的大規模データの利用におけるプライバシー保護の理論と応用
Project/Area Number |
16H02791
|
Research Institution | Okayama Shoka University |
Principal Investigator |
佐井 至道 岡山商科大学, 経済学部, 教授 (30186910)
|
Co-Investigator(Kenkyū-buntansha) |
星野 伸明 金沢大学, 経済学経営学系, 教授 (00313627)
渋谷 政昭 慶應義塾大学, 理工学部(矢上), 名誉教授 (20146723)
間野 修平 統計数理研究所, 数理・推論研究系, 准教授 (20372948)
伊藤 伸介 中央大学, 経済学部, 教授 (90363316)
稲葉 由之 明星大学, 経済学部, 教授 (80312437)
瀧 敦弘 広島大学, 社会科学研究科, 教授 (40216809)
佃 康司 東京大学, 大学院総合文化研究科, 特任講師 (30764972)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 官庁統計 / 個票データ / ミクロデータ / リスク評価 / 秘匿措置 / ビッグデータ |
Outline of Annual Research Achievements |
本研究の本年度の主目的は,データに対する秘匿方法・リスク評価方法の理論を確立し充実させることであり,データとしては個票データ,表形式データ,疑似ミクロデータが対象であった。 このうち個票データに対するリスク評価に用いられるピットマンモデル,ユーエンスモデル,ディリクレ過程など,確率分割やその関連領域における研究では,渋谷,間野,大和,佃などによってモデルの性質などについて多くの成果が得られた。また,汎用的なリスク評価についても星野によって研究が続けられた。 疑似ミクロデータについては,統計センターにおいて伊藤の提案した方法を取り入れて一般用ミクロデータとして提供が行われており,現在も改良が進められている。個票データのいくつかの項目に直接ノイズを加える方法についても佐井,星野,伊藤によって研究が進められ,ノイズの挿入方法などについて基礎が完成しつつある。今年度は特に,ノイズ変数などの型によるリスクへの影響について佐井によって研究が進められた。また,小林によってIPF法を用いた疑似個票データの作成法についても研究が進められた。さらに,リモートアクセスを用いた公開方法などに関する諸外国の現状についても幅広く情報が集められた。 本研究のもう一つの目的は,種々の分野のビッグデータの公開に関する研究を行うことであった。情報処理学会内のPWS(プライバシーワークショップ)とはそれぞれの研究集会へ相互に参加し合い,統計関連学会連合大会とPWS2017においては,それぞれ合同の企画セッションを設置し,その成果が互いの研究に取り入れられた。 本研究の成果については,2017年9月に行われた統計関連学会連合大会などの学会や国内外の各種シンポジウム,研究集会において報告を行うとともに,2017年12月14日,15日に統計数理研究所で主催した研究集会や研究会でも報告し,討論や意見交換を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
個票データの寸法指標を用いたリスク評価に用いられるピットマンモデルやディリクレ過程についての性質や,モデルを用いた推定の性質,その関連分野における研究では,佃を研究分担者に加えたこともあり,本年度当初の予想以上に研究が進捗した。この部分は本研究グループの貢献が最も大きい部分であり,諸外国の研究をも凌いでいる。また,汎用的なリスク評価についてはこれまで欧米では検討されてきたものの,国内での検討は十分行われてきておらず,本研究グループの貢献が大きい領域である。さらに,個票データの有用性とリスクの同時評価は,当初の予定どおり継続的に研究が進められているが,研究者が限定される状況が続いており対応が必要である。 表形式データに関しては,研究集会において欧米で伝統的に用いられているシステムであるτ-Argusに関する調査など諸外国の現状についての報告がされたが,まだ成果として目立ったものはない。 疑似ミクロデータについては,これまで国内ではノイズの挿入などについて積極的な研究が行われてこなかったが,ここ数年,本研究グループ内での研究が活発になっており,本年度は進捗が最も大きかった領域の一つとなった。特に母集団を考慮に入れた理論的な研究は国外においても少なく,貢献は大きいと考えられる。 種々の分野のビッグデータの公開に関する研究を行うことも主目的の一つであり,候補に挙がっていた医学統計,空間統計のそれぞれについて順調に研究が進められた。PWSとは昨年度を上回る交流が行われたこともあり,これまで統計の分野ではあまり考慮されてこなかった手法の導入が図られるとともに,移動履歴データなどのこれまで扱ってこなかったビッグデータについても理解が深まった。 以上,研究目的の個々の項目における進捗状況には一長一短があるが,総合的に考えるとほぼ当初の計画どおりの研究が行われたと考えられる。
|
Strategy for Future Research Activity |
ピットマンモデル,ユーエンスモデル,ディリクレ過程など,個票データのリスク評価に用いられる確率分割などの種々の性質やデータへの応用の研究は,本研究の中心であり,しかも他に類を見ない研究も多くあり,来年度以降も研究を進めて充実した成果を上げていきたい。個票データの有用性とリスクとの関係についての研究は軌道には乗っているものの研究者が限られており,研究体制を大きくするとともに汎用的な手法を開発したい。 表形式データの秘匿方法などの研究では,新たな理論的な貢献の実現ができておらず,切り口を整理するなどして研究の糸口を見つけたい。 疑似ミクロデータについては,ミクロアグリゲーションやノイズの挿入を中心に秘匿方法とリスク評価の検討が行われてきたが,後者については理論分布を用いた基礎的な研究にとどまっているため,これまで得られた理論の一般化と実データへの適用を行うとともに,現在はアイディアの段階にとどまっている局所的な分布属性を利用した手法の研究にも着手する。またスワッピングなど他の秘匿措置についても検討を行っていきたい。 PWSとの連携はさらに進めていきたい。来年度も,2018年9月の統計関連学会連合大会におけるPWSと連携した企画セッションや,2018年10月のPWS2018における統計関連の特別セッションなどが計画され,既に報告者などの人選を終えている。これらの機会を活かして,PWSのこれまでの成果を本研究にさらに取り入れるなど,引き続きステップアップを行いたい。 昨年度と同様に,個々のテーマごとに小研究会を数回開催するとともに,2018年12月には統計数理研究所で2日間にわたる研究集会を予定しており,官庁,企業などの実務者にも参加を促し,それらの意見も取り入れた研究を進めていく。また,本研究の成果については統計関連学会連合大会を初めとする国内外の学会やシンポジウムで公表する。
|
Research Products
(80 results)