2023 Fiscal Year Research-status Report
リーマン多様体上の最適化理論に基づく新たなデータコラボレーション手法の開発
Project/Area Number |
22K18866
|
Research Institution | University of Tsukuba |
Principal Investigator |
吉瀬 章子 筑波大学, システム情報系, 教授 (50234472)
|
Project Period (FY) |
2022-06-30 – 2025-03-31
|
Keywords | データコラボレーション / リーマン多様体 / 最適化理論 / 直交プロクラステス問題 / データ連携 |
Outline of Annual Research Achievements |
Withコロナの時代を迎え,地方自治体や国を超えた病院間でのデータ共有がこれまで以上に重要になってきている.しかしGDPRも施行され個人情報の秘匿性がより強く求められており,データをそのまま共有して解析することへの障壁は高くなっている.こうした困難を解決する手法として,データコラボレーション手法が提案された(Imakura and Sakurai 2020).この手法は.各事業体(病院)がもつデータと観測値のペアに関して,データをそのままではなく,各事業体固有の秘密の関数(通常は線形変換)を用いて加工したデータを分析者に送る.分析者は各事業体から届いたデータを,事業体固有の関数(線形変換)を用いて補正したいが,この関数を求めるため事業体に共通するアンカーデータを送り,このアンカーデータを加工した結果を入手して, 補正関数を求める.しかしこの補正関数を求める過程では,データの特徴量保存に関して改善の余地が残されている.特徴量を保存するためには線形変換を表す表現行列の階数に関する制約を加えることが理想的であるが,この制約をユークリッド空間における最適化問題として表現することには困難が伴う.本研究ではこのような制約を加えた集合がリーマン多様体の1つとして表せることに着目し,リーマン多様体上の最適化理論を応用することで,新たなデータコラボレーションの数理モデルを構築し,計算機実験を通して実用化を目指す.基盤となるリーマン多様体上の最適化理論とデータコラボレーション手法は,ともに新しい研究領域であり,これらの融合は双方の分野で注目を集める挑戦的な研究課題である. 2023年度は,2022年度に行った議論をさらに深め,上記の最適化問題を直交プロクラステス問題に帰着させ, 理論的に頑健かつ数値実験上でも優れるプロクラステスデータコラボレーション手法を提案した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2022年度に行った議論をさらに深め,上記の最適化問題を直交プロクラステス問題に帰着させ, 理論的に頑健かつ数値実験上でも優れるプロクラステスデータコラボレーション手法を提案し,その成果を論文"Data Collaboration Analysis Over Matrix Manifolds"にまとめることができた.
|
Strategy for Future Research Activity |
さらに分布に偏りのありNon-IIDなデータ間でも十分な精度が得られるようにプロクラステスデータコラボレーション手法を改良するとともに,データコラボレーション手法と同等の機密性を保証しながら,より簡便な方法でデータを統合できる新しい手法の開発にも取り組む予定である.
|
Causes of Carryover |
今年度は当初の計画より理論面での進展が多く,主に論文の執筆に注力した結果,比較的費用がかかる計算機実験であったり,海外での発表の機会が少なく,結果として次年度使用額が生じた.2024年度はカナダで開催される国際会議ISMPに参加する予定であり,円安の影響もあって多くの経費が必要になることが見込まれる.
|