2023 Fiscal Year Research-status Report
Design of Federated Learning Framework as Computer Systems
Project/Area Number |
23K16858
|
Research Institution | Osaka University |
Principal Investigator |
西川 広記 大阪大学, 大学院情報科学研究科, 助教 (90963538)
|
Project Period (FY) |
2023-04-01 – 2027-03-31
|
Keywords | 連合学習 / スケジューリング / データ分布 / ドメイン適応 |
Outline of Annual Research Achievements |
Internet of Things (IoT) デバイスにおけるデータのプライバシや権利保護の観点から、デー タの秘匿性を保ちながら機械学習モデルの学習を行う技術が求められている。そこで近年は、複数のクライアントが各自のデータを用いて学習を行い、学習後のモデルのみを集約し更新する動作を繰り返し行う、連合学習と呼ばれる分散型機械学習方式に注目が集まっている。通常、連合学習では各クライアントが自身のデータを用いてローカルに学習を行う。しかし、クライアントは通常、非均質である。つまり、各クライアントの計算能力や利用可能電力は 各々で全く異なり、各クライアントの持つ学習データの統計的性質もまたクライアント毎に異なるため、学習の収束性低下による学習の遅延や学習モデルの推論精度の低下が課題である。本年は、各クライアントにおける学習データのデータ分布に応じて連合学習を複数クラスタに分けて学習を行うという手法を提案した。事例適用として、車載からのカメラ画像を利用し、昼夜でデータ分布を大まかに分類し、クライアント数と各クライアント有する画像数を変化させながら精度を評価した。結果として、今回利用したデータセットであれば、データ分布の違いよりもむしろ全体的な学習データの枚数が大きく影響していることが明らかとなった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年は研究立ち上げの年であったために計算機の調達や追加で行った開発環境の構築に時間を要した。来年度からは加速的に実施されることが期待できる。
|
Strategy for Future Research Activity |
今後の研究推進方策は、データセットの変更と、さらにデータ分布やクライアント数、データサイズなどの関係性を明らかにすることである。今回事例適用的に行った車載カメラ画像は、連合学習のメカニズムを明らかにする上では応用的なデータセットであったために、細かな挙動について確認することができなかった。データセットを有名かつ基礎的なものに置き換え、同様に連合学習におけるクラスタリングを実施する予定である。
|