研究課題/領域番号 |
23K18501
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分62:応用情報学およびその関連分野
|
研究機関 | 東京大学 |
研究代表者 |
渋谷 哲朗 東京大学, 医科学研究所, 教授 (60396893)
|
研究期間 (年度) |
2023-06-30 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)
2025年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2024年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2023年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
|
キーワード | 差分プライバシー / ゲノムワイド相関解析 / グラフ理論 / アルゴリズム理論 / ビッグデータ / 検索技術 |
研究開始時の研究の概要 |
ゲノム情報や関連家系情報を扱うためには、データのプライバシー保護と実際の個人医療での活用の差異の公平性の二つが求められる。本研究では、家系データを含む大規模個人ゲノムデータから個人情報を漏洩することなく情報検索やその結果の診断への応用を可能とする、公平かつ安心な新たな大規模家系データ差分プライバシー保護技術の開拓をめざす。特に、差分プライバシー加工データの開示に関して公平性を保証する手法の開発、ゲノム情報に関して患者個人個人にそれらのデータベースから計算されたデータを個人医療等の用途に開示する際の差分プライバシー保護、家系図情報の差分プライバシー保護などに取り組む。
|
研究実績の概要 |
家系図から得られる様々な情報は、プライバシー保護の観点からは開示には慎重になる必要がある。このような状況に対し差分プライバシー技術)を活用することが考えられる。この技術はデータ、あるいは解析結果に対して差分プライバシーで定義されるノイズを加えることで、データに含まれる個人情報の特定を確率的に困難とすることを保証する手法で、差分プライバシー加工されたデータあるいは解析結果に対していかなる後処理(攻撃)を行ってもこの特定困難性が保証されることや、実際に行うのがノイズの付加だけであるために解析結果などが劣化するものの計算効率性などはほぼ犠牲とならないことから、提案者のDworkが2017年ゲーデル賞を受賞するなど、ビッグデータには親和性の高い新しいデータ保護の理論的枠組みとして近年非常に大きな脚光を浴びている手法である。しかしながら、この手法には複数の課題があり、本研究ではその解決に取り組むため、データ精度の向上、データ利用の公平性の向上、トポロジー情報の保護の3点を中心に進めている。 本年度は、まず、データ精度を上げるために、とくに家系データも用いるゲノムワイド解析の統計量に着目し、ランダムリスポンスおよびスムーズセンシティビティを活用してそれらの差分プライベートな公開の精度を高めることに成功した。さらに、重要遺伝子の差分プライベートな公開の精度を高めることが、データ公開の公平性を高める観点から、permutate-and-flip法の高精度化に取り組み、トップk重要遺伝子の公開の精度をより高めることにも成功した。さらに、トポロジー情報の保護に関しては、グラフ特徴量の差分プライベートな公開における通信量の削減および高精度化にも成功した。さらに、グラフ特徴量に関しては、グラフの各種彩色数などについて、基盤となる計算の複雑性について解明することにも成功した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
計画どおりに研究を進め、ゲノムワイド関連解析に関連した差分プラバシー技術の開発に関して3報、グラフ特徴量公開に関連した差分プライバシー技術に関して1報のほか、数報の関連論文の出版も行い、順調に成果を出している。今後は、これらの成果を家系図のより重要な公開法の開発へとつなげていくことを狙う予定である。
|
今後の研究の推進方策 |
家系図から得られる様々な情報は、プライバシー保護の観点からは開示には慎重になる必要がある。このような状況に対し差分プライバシー技術)を活用することが考えられる。この技術はデータ、あるいは解析結果に対して差分プライバシーで定義されるノイズを加えることで、データに含まれる個人情報の特定を確率的に困難とすることを保証する手法で、差分プライバシー加工されたデータあるいは解析結果に対していかなる後処理(攻撃)を行ってもこの特定困難性が保証されることや、実際に行うのがノイズの付加だけであるために解析結果などが劣化するものの計算効率性などはほぼ犠牲とならないことから、提案者のDworkが2017年ゲーデル賞を受賞するなど、ビッグデータには親和性の高い新しいデータ保護の理論的枠組みとして近年非常に大きな脚光を浴びている手法である。しかしながら、この手法には複数の課題があり、データ精度の向上、データ利用の公平性の向上、トポロジー情報の保護の3点を中心に進めてきた。今後はさらにこれまでの成果を踏まえた上で、1)データ精度の問題については、さらに、与えるノイズが少なくてすむノイズ付加手法や、多少多くても有用であるような開示情報がどのようなものであるかについて研究をすすめていく。2)データ利用の公平性に関しては、公開データの利用者間の公平性など、さらなる検討を行っていく。3)家系トポロジー情報の保護に関しては、さらに、保護できるトポロジーデータにどのようなものがあるかについて、さらなる検討を行っていく。そして、これらの検討を通して、大規模家系ゲノムデータを有効に活用できる差分プライバシー技術の確立を狙っていく。
|