Project/Area Number |
23K18501
|
Research Category |
Grant-in-Aid for Challenging Research (Exploratory)
|
Allocation Type | Multi-year Fund |
Review Section |
Medium-sized Section 62:Applied informatics and related fields
|
Research Institution | The University of Tokyo |
Principal Investigator |
渋谷 哲朗 東京大学, 医科学研究所, 教授 (60396893)
|
Project Period (FY) |
2023-06-30 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥6,240,000 (Direct Cost: ¥4,800,000、Indirect Cost: ¥1,440,000)
Fiscal Year 2025: ¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
Fiscal Year 2024: ¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
Fiscal Year 2023: ¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
|
Keywords | 差分プライバシー / ゲノムワイド相関解析 / グラフ理論 / アルゴリズム理論 / ビッグデータ / 検索技術 |
Outline of Research at the Start |
ゲノム情報や関連家系情報を扱うためには、データのプライバシー保護と実際の個人医療での活用の差異の公平性の二つが求められる。本研究では、家系データを含む大規模個人ゲノムデータから個人情報を漏洩することなく情報検索やその結果の診断への応用を可能とする、公平かつ安心な新たな大規模家系データ差分プライバシー保護技術の開拓をめざす。特に、差分プライバシー加工データの開示に関して公平性を保証する手法の開発、ゲノム情報に関して患者個人個人にそれらのデータベースから計算されたデータを個人医療等の用途に開示する際の差分プライバシー保護、家系図情報の差分プライバシー保護などに取り組む。
|
Outline of Annual Research Achievements |
家系図から得られる様々な情報は、プライバシー保護の観点からは開示には慎重になる必要がある。このような状況に対し差分プライバシー技術)を活用することが考えられる。この技術はデータ、あるいは解析結果に対して差分プライバシーで定義されるノイズを加えることで、データに含まれる個人情報の特定を確率的に困難とすることを保証する手法で、差分プライバシー加工されたデータあるいは解析結果に対していかなる後処理(攻撃)を行ってもこの特定困難性が保証されることや、実際に行うのがノイズの付加だけであるために解析結果などが劣化するものの計算効率性などはほぼ犠牲とならないことから、提案者のDworkが2017年ゲーデル賞を受賞するなど、ビッグデータには親和性の高い新しいデータ保護の理論的枠組みとして近年非常に大きな脚光を浴びている手法である。しかしながら、この手法には複数の課題があり、本研究ではその解決に取り組むため、データ精度の向上、データ利用の公平性の向上、トポロジー情報の保護の3点を中心に進めている。 本年度は、まず、データ精度を上げるために、とくに家系データも用いるゲノムワイド解析の統計量に着目し、ランダムリスポンスおよびスムーズセンシティビティを活用してそれらの差分プライベートな公開の精度を高めることに成功した。さらに、重要遺伝子の差分プライベートな公開の精度を高めることが、データ公開の公平性を高める観点から、permutate-and-flip法の高精度化に取り組み、トップk重要遺伝子の公開の精度をより高めることにも成功した。さらに、トポロジー情報の保護に関しては、グラフ特徴量の差分プライベートな公開における通信量の削減および高精度化にも成功した。さらに、グラフ特徴量に関しては、グラフの各種彩色数などについて、基盤となる計算の複雑性について解明することにも成功した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
計画どおりに研究を進め、ゲノムワイド関連解析に関連した差分プラバシー技術の開発に関して3報、グラフ特徴量公開に関連した差分プライバシー技術に関して1報のほか、数報の関連論文の出版も行い、順調に成果を出している。今後は、これらの成果を家系図のより重要な公開法の開発へとつなげていくことを狙う予定である。
|
Strategy for Future Research Activity |
家系図から得られる様々な情報は、プライバシー保護の観点からは開示には慎重になる必要がある。このような状況に対し差分プライバシー技術)を活用することが考えられる。この技術はデータ、あるいは解析結果に対して差分プライバシーで定義されるノイズを加えることで、データに含まれる個人情報の特定を確率的に困難とすることを保証する手法で、差分プライバシー加工されたデータあるいは解析結果に対していかなる後処理(攻撃)を行ってもこの特定困難性が保証されることや、実際に行うのがノイズの付加だけであるために解析結果などが劣化するものの計算効率性などはほぼ犠牲とならないことから、提案者のDworkが2017年ゲーデル賞を受賞するなど、ビッグデータには親和性の高い新しいデータ保護の理論的枠組みとして近年非常に大きな脚光を浴びている手法である。しかしながら、この手法には複数の課題があり、データ精度の向上、データ利用の公平性の向上、トポロジー情報の保護の3点を中心に進めてきた。今後はさらにこれまでの成果を踏まえた上で、1)データ精度の問題については、さらに、与えるノイズが少なくてすむノイズ付加手法や、多少多くても有用であるような開示情報がどのようなものであるかについて研究をすすめていく。2)データ利用の公平性に関しては、公開データの利用者間の公平性など、さらなる検討を行っていく。3)家系トポロジー情報の保護に関しては、さらに、保護できるトポロジーデータにどのようなものがあるかについて、さらなる検討を行っていく。そして、これらの検討を通して、大規模家系ゲノムデータを有効に活用できる差分プライバシー技術の確立を狙っていく。
|