リーマン多様体上の最適化理論に基づく新たなデータコラボレーション手法の開発
Project/Area Number |
22K18866
|
Research Category |
Grant-in-Aid for Challenging Research (Exploratory)
|
Allocation Type | Multi-year Fund |
Review Section |
Medium-sized Section 25:Social systems engineering, safety engineering, disaster prevention engineering, and related fields
|
Research Institution | University of Tsukuba |
Principal Investigator |
吉瀬 章子 筑波大学, システム情報系, 教授 (50234472)
|
Project Period (FY) |
2022-06-30 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥6,370,000 (Direct Cost: ¥4,900,000、Indirect Cost: ¥1,470,000)
Fiscal Year 2024: ¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
Fiscal Year 2023: ¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
Fiscal Year 2022: ¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
|
Keywords | データコラボレーション / リーマン多様体 / 最適化理論 / 直交プロクラステス問題 / データ連携 |
Outline of Research at the Start |
Withコロナの時代を迎え,地方自治体や国を超えた病院間でのデータ共有がこれまで以上に重要になってきている.しかし個人情報の秘匿性がより強く求められており,データをそのまま共有して解析することへの障壁は高くなっている.こうした困難を解決する手法として昨年,中間表現を用いたセキュアなデータコラボレーション手法が提案されている(Imakura and Sakurai(2020)).本研究ではリーマン多様体上の最適化理論を応用することで,データの特徴量の保存を可能にする,新たなデータコラボレーションの数理モデルを構築するとともに,計算機実験を通して実用化に耐えうる手法として確立することを目指す.
|
Outline of Annual Research Achievements |
Withコロナの時代を迎え,地方自治体や国を超えた病院間でのデータ共有がこれまで以上に重要になってきている.しかしGDPRも施行され個人情報の秘匿性がより強く求められており,データをそのまま共有して解析することへの障壁は高くなっている.こうした困難を解決する手法として,データコラボレーション手法が提案された(Imakura and Sakurai 2020).この手法は.各事業体(病院)がもつデータと観測値のペアに関して,データをそのままではなく,各事業体固有の秘密の関数(通常は線形変換)を用いて加工したデータを分析者に送る.分析者は各事業体から届いたデータを,事業体固有の関数(線形変換)を用いて補正したいが,この関数を求めるため事業体に共通するアンカーデータを送り,このアンカーデータを加工した結果を入手して, 補正関数を求める.しかしこの補正関数を求める過程では,データの特徴量保存に関して改善の余地が残されている.特徴量を保存するためには線形変換を表す表現行列の階数に関する制約を加えることが理想的であるが,この制約をユークリッド空間における最適化問題として表現することには困難が伴う.本研究ではこのような制約を加えた集合がリーマン多様体の1つとして表せることに着目し,リーマン多様体上の最適化理論を応用することで,新たなデータコラボレーションの数理モデルを構築し,計算機実験を通して実用化を目指す.基盤となるリーマン多様体上の最適化理論とデータコラボレーション手法は,ともに新しい研究領域であり,これらの融合は双方の分野で注目を集める挑戦的な研究課題である. 2023年度は,2022年度に行った議論をさらに深め,上記の最適化問題を直交プロクラステス問題に帰着させ, 理論的に頑健かつ数値実験上でも優れるプロクラステスデータコラボレーション手法を提案した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2022年度に行った議論をさらに深め,上記の最適化問題を直交プロクラステス問題に帰着させ, 理論的に頑健かつ数値実験上でも優れるプロクラステスデータコラボレーション手法を提案し,その成果を論文"Data Collaboration Analysis Over Matrix Manifolds"にまとめることができた.
|
Strategy for Future Research Activity |
さらに分布に偏りのありNon-IIDなデータ間でも十分な精度が得られるようにプロクラステスデータコラボレーション手法を改良するとともに,データコラボレーション手法と同等の機密性を保証しながら,より簡便な方法でデータを統合できる新しい手法の開発にも取り組む予定である.
|
Report
(2 results)
Research Products
(16 results)