Design of Federated Learning Framework as Computer Systems
Project/Area Number |
23K16858
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 60040:Computer system-related
|
Research Institution | Osaka University |
Principal Investigator |
西川 広記 大阪大学, 大学院情報科学研究科, 助教 (90963538)
|
Project Period (FY) |
2023-04-01 – 2027-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2026: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2025: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2024: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2023: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
|
Keywords | 連合学習 / スケジューリング / データ分布 / ドメイン適応 / Internet of Things / 協調設計 |
Outline of Research at the Start |
Internet of Things におけるデータのプライバシや権利保護の観点から、データの秘匿性を保ちながら機械学習モデルの学習を行う技術が求められている。そこで近年は、連合学習と呼ばれる分散型機械学習方式に注目が集まっている。一般的な学習では、各クライアントが自身のデータを用いて学習を行う。しかし、各クライアントの計算能力や電力は 各々で全く異なり、各クライアントの持つ学習データの特徴もまたクライアントによって異なる。これによる、学習の収束性低下や推論精度の向上が課題である。本研究では、連合学習におけるクライアント間の非均質性を低減し、学習効率の向上および推論精度の向上を目指す。
|
Outline of Annual Research Achievements |
Internet of Things (IoT) デバイスにおけるデータのプライバシや権利保護の観点から、デー タの秘匿性を保ちながら機械学習モデルの学習を行う技術が求められている。そこで近年は、複数のクライアントが各自のデータを用いて学習を行い、学習後のモデルのみを集約し更新する動作を繰り返し行う、連合学習と呼ばれる分散型機械学習方式に注目が集まっている。通常、連合学習では各クライアントが自身のデータを用いてローカルに学習を行う。しかし、クライアントは通常、非均質である。つまり、各クライアントの計算能力や利用可能電力は 各々で全く異なり、各クライアントの持つ学習データの統計的性質もまたクライアント毎に異なるため、学習の収束性低下による学習の遅延や学習モデルの推論精度の低下が課題である。本年は、各クライアントにおける学習データのデータ分布に応じて連合学習を複数クラスタに分けて学習を行うという手法を提案した。事例適用として、車載からのカメラ画像を利用し、昼夜でデータ分布を大まかに分類し、クライアント数と各クライアント有する画像数を変化させながら精度を評価した。結果として、今回利用したデータセットであれば、データ分布の違いよりもむしろ全体的な学習データの枚数が大きく影響していることが明らかとなった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年は研究立ち上げの年であったために計算機の調達や追加で行った開発環境の構築に時間を要した。来年度からは加速的に実施されることが期待できる。
|
Strategy for Future Research Activity |
今後の研究推進方策は、データセットの変更と、さらにデータ分布やクライアント数、データサイズなどの関係性を明らかにすることである。今回事例適用的に行った車載カメラ画像は、連合学習のメカニズムを明らかにする上では応用的なデータセットであったために、細かな挙動について確認することができなかった。データセットを有名かつ基礎的なものに置き換え、同様に連合学習におけるクラスタリングを実施する予定である。
|
Report
(1 results)
Research Products
(5 results)