大規模家系データを活用した個人医療の実現のための差分プライバシー保護技術の開拓

研究課題

研究課題/領域番号	23K18501
研究種目	挑戦的研究(萌芽)
配分区分	基金
審査区分	中区分62:応用情報学およびその関連分野
研究機関	東京大学
研究代表者	渋谷哲朗東京大学, 医科学研究所, 教授 (60396893)
研究期間 (年度)	2023-06-30 – 2026-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円) 2025年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円) 2024年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円) 2023年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
キーワード	差分プライバシー / ゲノムワイド相関解析 / グラフ理論 / アルゴリズム理論 / ビッグデータ / 検索技術
研究開始時の研究の概要	ゲノム情報や関連家系情報を扱うためには、データのプライバシー保護と実際の個人医療での活用の差異の公平性の二つが求められる。本研究では、家系データを含む大規模個人ゲノムデータから個人情報を漏洩することなく情報検索やその結果の診断への応用を可能とする、公平かつ安心な新たな大規模家系データ差分プライバシー保護技術の開拓をめざす。特に、差分プライバシー加工データの開示に関して公平性を保証する手法の開発、ゲノム情報に関して患者個人個人にそれらのデータベースから計算されたデータを個人医療等の用途に開示する際の差分プライバシー保護、家系図情報の差分プライバシー保護などに取り組む。
研究実績の概要	家系図から得られる様々な情報は、プライバシー保護の観点からは開示には慎重になる必要がある。このような状況に対し差分プライバシー技術）を活用することが考えられる。この技術はデータ、あるいは解析結果に対して差分プライバシーで定義されるノイズを加えることで、データに含まれる個人情報の特定を確率的に困難とすることを保証する手法で、差分プライバシー加工されたデータあるいは解析結果に対していかなる後処理（攻撃）を行ってもこの特定困難性が保証されることや、実際に行うのがノイズの付加だけであるために解析結果などが劣化するものの計算効率性などはほぼ犠牲とならないことから、提案者のDworkが2017年ゲーデル賞を受賞するなど、ビッグデータには親和性の高い新しいデータ保護の理論的枠組みとして近年非常に大きな脚光を浴びている手法である。しかしながら、この手法には複数の課題があり、本研究ではその解決に取り組むため、データ精度の向上、データ利用の公平性の向上、トポロジー情報の保護の３点を中心に進めている。本年度は、まず、データ精度を上げるために、とくに家系データも用いるゲノムワイド解析の統計量に着目し、ランダムリスポンスおよびスムーズセンシティビティを活用してそれらの差分プライベートな公開の精度を高めることに成功した。さらに、重要遺伝子の差分プライベートな公開の精度を高めることが、データ公開の公平性を高める観点から、permutate-and-flip法の高精度化に取り組み、トップk重要遺伝子の公開の精度をより高めることにも成功した。さらに、トポロジー情報の保護に関しては、グラフ特徴量の差分プライベートな公開における通信量の削減および高精度化にも成功した。さらに、グラフ特徴量に関しては、グラフの各種彩色数などについて、基盤となる計算の複雑性について解明することにも成功した。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由計画どおりに研究を進め、ゲノムワイド関連解析に関連した差分プラバシー技術の開発に関して３報、グラフ特徴量公開に関連した差分プライバシー技術に関して１報のほか、数報の関連論文の出版も行い、順調に成果を出している。今後は、これらの成果を家系図のより重要な公開法の開発へとつなげていくことを狙う予定である。
今後の研究の推進方策	家系図から得られる様々な情報は、プライバシー保護の観点からは開示には慎重になる必要がある。このような状況に対し差分プライバシー技術）を活用することが考えられる。この技術はデータ、あるいは解析結果に対して差分プライバシーで定義されるノイズを加えることで、データに含まれる個人情報の特定を確率的に困難とすることを保証する手法で、差分プライバシー加工されたデータあるいは解析結果に対していかなる後処理（攻撃）を行ってもこの特定困難性が保証されることや、実際に行うのがノイズの付加だけであるために解析結果などが劣化するものの計算効率性などはほぼ犠牲とならないことから、提案者のDworkが2017年ゲーデル賞を受賞するなど、ビッグデータには親和性の高い新しいデータ保護の理論的枠組みとして近年非常に大きな脚光を浴びている手法である。しかしながら、この手法には複数の課題があり、データ精度の向上、データ利用の公平性の向上、トポロジー情報の保護の３点を中心に進めてきた。今後はさらにこれまでの成果を踏まえた上で、1)データ精度の問題については、さらに、与えるノイズが少なくてすむノイズ付加手法や、多少多くても有用であるような開示情報がどのようなものであるかについて研究をすすめていく。2)データ利用の公平性に関しては、公開データの利用者間の公平性など、さらなる検討を行っていく。3)家系トポロジー情報の保護に関しては、さらに、保護できるトポロジーデータにどのようなものがあるかについて、さらなる検討を行っていく。そして、これらの検討を通して、大規模家系ゲノムデータを有効に活用できる差分プライバシー技術の確立を狙っていく。

報告書

(1件)

2023 実施状況報告書

研究成果
(13件)

すべて 2024 2023

すべて雑誌論文 (10件) (うち国際共著 2件、査読あり 10件、オープンアクセス 1件) 学会発表 (3件) (うち国際学会 1件、招待講演 1件)

[雑誌論文] Affine optimal k-proper connected edge colorings2024
- 著者名/発表者名
  Robert Barish, Tetsuo Shibuya
- 雑誌名
  
  Optimization Letters
  
  巻: -
- 関連する報告書
  2023 実施状況報告書
- 査読あり
[雑誌論文] Counting on rainbow k-connections2024
- 著者名/発表者名
  Robert Barish, Tetsuo Shibuya
- 雑誌名
  
  Theory and Applications of Models of Computation
  
  巻: -
- 関連する報告書
  2023 実施状況報告書
- 査読あり
[雑誌論文] Counting 2-factors of 4-regular bipartite graphs is #P-complete2024
- 著者名/発表者名
  Robert Barish, Tetsuo Shibuya
- 雑誌名
  
  LNCS
  
  巻: -
- 関連する報告書
  2023 実施状況報告書
- 査読あり
[雑誌論文] Recognition and proper coloring of unit segment intersection graphs2024
- 著者名/発表者名
  Robert Barish, Tetsuo Shibuya
- 雑誌名
  
  Scandinavian Symposium on Algorithm Theory
  
  巻: -
- 関連する報告書
  2023 実施状況報告書
- 査読あり
[雑誌論文] Genetic algorithm-based feature selection with manifold learning for cancer classification using microarray data2023
- 著者名/発表者名
  Wang Zixuan、Zhou Yi、Takagi Tatsuya、Song Jiangning、Tian Yu-Shi、Shibuya Tetsuo
- 雑誌名
  
  BMC Bioinformatics
  
  巻: 24 号: 1
- DOI
  10.1186/s12859-023-05267-3
- 関連する報告書
  2023 実施状況報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Unbiased Locally Private Estimator for Polynomials of Laplacian Variables2023
- 著者名/発表者名
  Hillebrand Quentin、Suppakitpaisarn Vorapong、Shibuya Tetsuo
- 雑誌名
  
  Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining
  
  巻: - ページ: 741-751
- DOI
  10.1145/3580305.3599537
- 関連する報告書
  2023 実施状況報告書
- 査読あり / 国際共著
[雑誌論文] Privacy-Preserving Genomic Statistical Analysis Under Local Differential Privacy2023
- 著者名/発表者名
  Yamamoto Akito、Shibuya Tetsuo
- 雑誌名
  
  LNCS
  
  巻: 13942 ページ: 40-48
- DOI
  10.1007/978-3-031-37586-6_3
- ISBN
  9783031375859, 9783031375866
- 関連する報告書
  2023 実施状況報告書
- 査読あり
[雑誌論文] Privacy-Preserving Publication of GWAS Statistics using Smooth Sensitivity2023
- 著者名/発表者名
  Yamamoto Akito、Shibuya Tetsuo
- 雑誌名
  
  Proc. PST
  
  巻: - ページ: 1-12
- DOI
  10.1109/pst58708.2023.10320160
- 関連する報告書
  2023 実施状況報告書
- 査読あり
[雑誌論文] A Joint Permute-and-Flip and Its Enhancement for Large-Scale Genomic Statistical Analysis2023
- 著者名/発表者名
  Yamamoto Akito、Shibuya Tetsuo
- 雑誌名
  
  IEEE International Conference on Data Mining Workshops
  
  巻: - ページ: 217-226
- DOI
  10.1109/icdmw60847.2023.00034
- 関連する報告書
  2023 実施状況報告書
- 査読あり
[雑誌論文] The Fine-Grained Complexity of?Approximately Counting Proper Connected Colorings (Extended Abstract)2023
- 著者名/発表者名
  Barish Robert D.、Shibuya Tetsuo
- 雑誌名
  
  Combinatorial Optimization and Applications
  
  巻: - ページ: 123-136
- DOI
  10.1007/978-3-031-49614-1_8
- ISBN
  9783031496134, 9783031496141
- 関連する報告書
  2023 実施状況報告書
- 査読あり
[学会発表] Communication Cost Reduction for Subgraph Counting under Local Differential Privacy via Hash Functions2024
- 著者名/発表者名
  Quentin Hillebrand, Vorapong Suppakitpaisarn, and Tetsuo Shibuya
- 学会等名
  情報処理学会アルゴリズム研究会
- 関連する報告書
  2023 実施状況報告書
[学会発表] Toward Privacy Preserving Biomedical Data Analysis2023
- 著者名/発表者名
  Tetsuo Shibuya
- 学会等名
  the 10th International Conference on Biomedical and Bioinformatics Engineering
- 関連する報告書
  2023 実施状況報告書
- 国際学会 / 招待講演
[学会発表] 医療情報における差分プライベートなk匿名化について2023
- 著者名/発表者名
  Akito Yamamoto, Eizen Kimura, Tetsuo Shibuya
- 学会等名
  第43回　医療情報学連合大会
- 関連する報告書
  2023 実施状況報告書

大規模家系データを活用した個人医療の実現のための差分プライバシー保護技術の開拓

研究代表者

渋谷 哲朗 東京大学, 医科学研究所, 教授 (60396893)

6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] Affine optimal k-proper connected edge colorings2024

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Counting on rainbow k-connections2024

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Counting 2-factors of 4-regular bipartite graphs is #P-complete2024

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Recognition and proper coloring of unit segment intersection graphs2024

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Genetic algorithm-based feature selection with manifold learning for cancer classification using microarray data2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Unbiased Locally Private Estimator for Polynomials of Laplacian Variables2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Privacy-Preserving Genomic Statistical Analysis Under Local Differential Privacy2023

著者名/発表者名

雑誌名

DOI

ISBN

関連する報告書

[雑誌論文] Privacy-Preserving Publication of GWAS Statistics using Smooth Sensitivity2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] A Joint Permute-and-Flip and Its Enhancement for Large-Scale Genomic Statistical Analysis2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] The Fine-Grained Complexity of?Approximately Counting Proper Connected Colorings (Extended Abstract)2023

著者名/発表者名

雑誌名

DOI

ISBN

関連する報告書

[学会発表] Communication Cost Reduction for Subgraph Counting under Local Differential Privacy via Hash Functions2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] Toward Privacy Preserving Biomedical Data Analysis2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 医療情報における差分プライベートなk匿名化について2023

著者名/発表者名

学会等名

関連する報告書

渋谷哲朗東京大学, 医科学研究所, 教授 (60396893)