2022 Fiscal Year Annual Research Report
Effcient and secure search via graph annymization techniques for large individual genome database
Project/Area Number |
20K21827
|
Research Institution | The University of Tokyo |
Principal Investigator |
渋谷 哲朗 東京大学, 医科学研究所, 教授 (60396893)
|
Project Period (FY) |
2020-07-30 – 2023-03-31
|
Keywords | アルゴリズム理論 / 個人ゲノム / プライバシー / 検索技術 / グラフ理論 |
Outline of Annual Research Achievements |
本研究の目的は大規模個人ゲノムデータに対し、究極の個人情報ともいわれるゲノムデータの倫理的特性に合致した安全かつ効率的な検索・解析手法を実現することである。その実現のために、様々なデータを複雑に表現できるグラフ構造を活用し、必要なデータを保持しつつ匿名化を行うグラフ匿名化とよぶ手法の確立をめざしている。特に複数ゲノムをコンパクトに表現する技術として、ゲノムグラフとよばれる技術があり、このゲノムグラフを拡張することによってこれらを実現するとともに、匿名化データに対する検索・解析技術の開発も行っていくことをめざしている。 昨年度までに、ゲノムグラフを圧縮表現する技術の開発に成功した。また、χ2統計量やコクラン・アーミテージ統計量、TDT統計量やそれらの上位情報の差分プライバシーにもとづく匿名化公開手法の開発に成功した。また、グラフ理論的な観点を活用し、データ保護を行うwearleveling技術の開発にも成功した。 最終年度である本年度は、これらの研究をさらに推し進め、また、医療情報からグラフ情報を抽出する技術として重要な支援言語技術の開発に成功した。また、がんの遺伝子発現情報からグラフ情報を抽出するための基盤技術の開発にも成功した。さらに、グラフ匿名化の基盤となるグラフ理論の研究として、グラフ匿名化の際のグラフ情報の編集がどのようにグラフの特質に影響を与えるか、について理論的な結果を得ることに成功した。同様に文字列に対する編集についても文字列の特質にどのような影響を与えるかについての理論的な結果を得ることにも成功した。さらに離散フーリエ変換を活用した、統計値上位情報の公開のためのさらに有効な手法の開発に成功した。また、k-匿名化と差分プライバシーの双方の要請に対応する新たな匿名化技術の開発にも成功した。
|