リーマン多様体上の最適化理論に基づく新たなデータコラボレーション手法の開発
Project/Area Number |
22K18866
|
Research Category |
Grant-in-Aid for Challenging Research (Exploratory)
|
Allocation Type | Multi-year Fund |
Review Section |
Medium-sized Section 25:Social systems engineering, safety engineering, disaster prevention engineering, and related fields
|
Research Institution | University of Tsukuba |
Principal Investigator |
吉瀬 章子 筑波大学, システム情報系, 教授 (50234472)
|
Project Period (FY) |
2022-06-30 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥6,370,000 (Direct Cost: ¥4,900,000、Indirect Cost: ¥1,470,000)
Fiscal Year 2024: ¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
Fiscal Year 2023: ¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
Fiscal Year 2022: ¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
|
Keywords | データコラボレーション / リーマン多様体 / 最適化理論 / データ連携 |
Outline of Research at the Start |
Withコロナの時代を迎え,地方自治体や国を超えた病院間でのデータ共有がこれまで以上に重要になってきている.しかし個人情報の秘匿性がより強く求められており,データをそのまま共有して解析することへの障壁は高くなっている.こうした困難を解決する手法として昨年,中間表現を用いたセキュアなデータコラボレーション手法が提案されている(Imakura and Sakurai(2020)).本研究ではリーマン多様体上の最適化理論を応用することで,データの特徴量の保存を可能にする,新たなデータコラボレーションの数理モデルを構築するとともに,計算機実験を通して実用化に耐えうる手法として確立することを目指す.
|
Outline of Annual Research Achievements |
Withコロナの時代を迎え,地方自治体や国を超えた病院間でのデータ共有がこれまで以上に重要になってきている.しかしGDPRも施行され個人情報の秘匿性がより強く求められており,データをそのまま共有して解析することへの障壁は高くなっている.こうした困難を解決する手法として,データコラボレーション手法が提案された(Imakura and Sakurai 2020).この手法は.各事業体(病院)がもつデータと観測値のペアに関して,データをそのままではなく,各事業体固有の秘密の関数(通常は線形変換)を用いて加工したデータを分析者に送る.分析者は各事業体から届いたデータを,事業体固有の関数(線形変換)を用いて補正したいが,この関数を求めるため事業体に共通するアンカーデータを送り,このアンカーデータを加工した結果を入手して, 補正関数を求める.しかしこの補正関数を求める過程では,データの特徴量保存に関して改善の余地が残されている.特徴量を保存するためには線形変換を表す表現行列の階数に関する制約を加えることが理想的であるが,この制約をユークリッド空間における最適化問題として表現することには困難が伴う.本研究ではこのような制約を加えた集合がリーマン多様体の1つとして表せることに着目し,リーマン多様体上の最適化理論を応用することで,新たなデータコラボレーションの数理モデルを構築し,計算機実験を通して実用化を目指す.基盤となるリーマン多様体上の最適化理論とデータコラボレーション手法は,ともに新しい研究領域であり,これらの融合は双方の分野で注目を集める挑戦的な研究課題である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
この研究課題を検討する途上で,これまでリーマン多様体の最適化問題として取り上げられることが多かった,無制約条件下でのリーマン最適化のみでは対応できない可能性が高いことから,制約条件付きのリーマン最適化に対するアルゴリズムを検討してきた.これらの成果を論文としてまとめ投稿するとともに,いくつかの国内会議や国際会議で発表を行った. さらにデータコラボレーションで用いる中間表現の作成のための,新たな行列多様体上の最適化問題と,さらにハイパーパラメータの自動チューニングを組み込んだ求解アルゴリズムを提案し,そのアルゴリズムを実証的に評価するため,人工的なデータセットと実世界のデータセットを用いて計算機実験を行った.この結果,認証性能の平均値が大幅に改善され,提案アルゴリズムの有効性が検証された.この結果を論文「Creating Collaborative Data Representations Using Matrix Manifold Optimization and Automated Hyperparameter Tuning」にまとめ,データコラボレーション手法の提案者である筑波大学の今倉暁准教授らとのゼミにおいて有益な示唆を頂くとともに,2023年4月に行われる国際会議「3rd IEEE International Conference on Electronic Communications, Internet of Things and Big Data 2023」での発表が受理された.
|
Strategy for Future Research Activity |
「リーマン多様体の最適化理論」,「データコラボレーション手法」ともに活発に研究が行われているが,世界的規模での普及は端緒にあり,今後の研究の進展が期待されていることから,今後も国際共同研究も視野に入れ,リーマン多様体上の最適化の新たな理論と実用可能性を探索し,セキュアなデータ連携手法の提案と確立に取り組んでいきたいと考えている. 具体的には,提案アルゴリズムの高速化と精度の向上を目指すとともに,今倉准教授から頂いた示唆をもとに,提案アルゴリズムが得意とする例題の定性的な特徴づけを行いたいと考えている.また最近,Hirai, Nieuwboer, Walterによって発表された論文「Interior-point methods on manifolds: theory and applications」の内容とも関連して,提案アルゴリズムで用いている関数のリーマン多様体上の性質を明らかにすることで,理論的な貢献にも取り組みたいと思っている.
|
Report
(1 results)
Research Products
(6 results)