2023 Fiscal Year Research-status Report
Differential Privacy for Personalized Medicine using Large Pedigree Data
Project/Area Number |
23K18501
|
Research Institution | The University of Tokyo |
Principal Investigator |
渋谷 哲朗 東京大学, 医科学研究所, 教授 (60396893)
|
Project Period (FY) |
2023-06-30 – 2026-03-31
|
Keywords | 差分プライバシー / ゲノムワイド相関解析 / グラフ理論 |
Outline of Annual Research Achievements |
家系図から得られる様々な情報は、プライバシー保護の観点からは開示には慎重になる必要がある。このような状況に対し差分プライバシー技術)を活用することが考えられる。この技術はデータ、あるいは解析結果に対して差分プライバシーで定義されるノイズを加えることで、データに含まれる個人情報の特定を確率的に困難とすることを保証する手法で、差分プライバシー加工されたデータあるいは解析結果に対していかなる後処理(攻撃)を行ってもこの特定困難性が保証されることや、実際に行うのがノイズの付加だけであるために解析結果などが劣化するものの計算効率性などはほぼ犠牲とならないことから、提案者のDworkが2017年ゲーデル賞を受賞するなど、ビッグデータには親和性の高い新しいデータ保護の理論的枠組みとして近年非常に大きな脚光を浴びている手法である。しかしながら、この手法には複数の課題があり、本研究ではその解決に取り組むため、データ精度の向上、データ利用の公平性の向上、トポロジー情報の保護の3点を中心に進めている。 本年度は、まず、データ精度を上げるために、とくに家系データも用いるゲノムワイド解析の統計量に着目し、ランダムリスポンスおよびスムーズセンシティビティを活用してそれらの差分プライベートな公開の精度を高めることに成功した。さらに、重要遺伝子の差分プライベートな公開の精度を高めることが、データ公開の公平性を高める観点から、permutate-and-flip法の高精度化に取り組み、トップk重要遺伝子の公開の精度をより高めることにも成功した。さらに、トポロジー情報の保護に関しては、グラフ特徴量の差分プライベートな公開における通信量の削減および高精度化にも成功した。さらに、グラフ特徴量に関しては、グラフの各種彩色数などについて、基盤となる計算の複雑性について解明することにも成功した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
計画どおりに研究を進め、ゲノムワイド関連解析に関連した差分プラバシー技術の開発に関して3報、グラフ特徴量公開に関連した差分プライバシー技術に関して1報のほか、数報の関連論文の出版も行い、順調に成果を出している。今後は、これらの成果を家系図のより重要な公開法の開発へとつなげていくことを狙う予定である。
|
Strategy for Future Research Activity |
家系図から得られる様々な情報は、プライバシー保護の観点からは開示には慎重になる必要がある。このような状況に対し差分プライバシー技術)を活用することが考えられる。この技術はデータ、あるいは解析結果に対して差分プライバシーで定義されるノイズを加えることで、データに含まれる個人情報の特定を確率的に困難とすることを保証する手法で、差分プライバシー加工されたデータあるいは解析結果に対していかなる後処理(攻撃)を行ってもこの特定困難性が保証されることや、実際に行うのがノイズの付加だけであるために解析結果などが劣化するものの計算効率性などはほぼ犠牲とならないことから、提案者のDworkが2017年ゲーデル賞を受賞するなど、ビッグデータには親和性の高い新しいデータ保護の理論的枠組みとして近年非常に大きな脚光を浴びている手法である。しかしながら、この手法には複数の課題があり、データ精度の向上、データ利用の公平性の向上、トポロジー情報の保護の3点を中心に進めてきた。今後はさらにこれまでの成果を踏まえた上で、1)データ精度の問題については、さらに、与えるノイズが少なくてすむノイズ付加手法や、多少多くても有用であるような開示情報がどのようなものであるかについて研究をすすめていく。2)データ利用の公平性に関しては、公開データの利用者間の公平性など、さらなる検討を行っていく。3)家系トポロジー情報の保護に関しては、さらに、保護できるトポロジーデータにどのようなものがあるかについて、さらなる検討を行っていく。そして、これらの検討を通して、大規模家系ゲノムデータを有効に活用できる差分プライバシー技術の確立を狙っていく。
|
Causes of Carryover |
理論的な研究を中心に進めたことで、研究用PCの導入を後ろ倒ししたことで予定よりも使用額が少なく推移しているが、今後、全体としては、研究うちあわせ、発表などの旅費、研究用PC等の購入を進め、研究を推進していく予定である。
|