研究課題/領域番号 |
23K16858
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分60040:計算機システム関連
|
研究機関 | 大阪大学 |
研究代表者 |
西川 広記 大阪大学, 大学院情報科学研究科, 助教 (90963538)
|
研究期間 (年度) |
2023-04-01 – 2027-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2026年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2025年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2024年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | 連合学習 / スケジューリング / データ分布 / ドメイン適応 / Internet of Things / 協調設計 |
研究開始時の研究の概要 |
Internet of Things におけるデータのプライバシや権利保護の観点から、データの秘匿性を保ちながら機械学習モデルの学習を行う技術が求められている。そこで近年は、連合学習と呼ばれる分散型機械学習方式に注目が集まっている。一般的な学習では、各クライアントが自身のデータを用いて学習を行う。しかし、各クライアントの計算能力や電力は 各々で全く異なり、各クライアントの持つ学習データの特徴もまたクライアントによって異なる。これによる、学習の収束性低下や推論精度の向上が課題である。本研究では、連合学習におけるクライアント間の非均質性を低減し、学習効率の向上および推論精度の向上を目指す。
|
研究実績の概要 |
Internet of Things (IoT) デバイスにおけるデータのプライバシや権利保護の観点から、デー タの秘匿性を保ちながら機械学習モデルの学習を行う技術が求められている。そこで近年は、複数のクライアントが各自のデータを用いて学習を行い、学習後のモデルのみを集約し更新する動作を繰り返し行う、連合学習と呼ばれる分散型機械学習方式に注目が集まっている。通常、連合学習では各クライアントが自身のデータを用いてローカルに学習を行う。しかし、クライアントは通常、非均質である。つまり、各クライアントの計算能力や利用可能電力は 各々で全く異なり、各クライアントの持つ学習データの統計的性質もまたクライアント毎に異なるため、学習の収束性低下による学習の遅延や学習モデルの推論精度の低下が課題である。本年は、各クライアントにおける学習データのデータ分布に応じて連合学習を複数クラスタに分けて学習を行うという手法を提案した。事例適用として、車載からのカメラ画像を利用し、昼夜でデータ分布を大まかに分類し、クライアント数と各クライアント有する画像数を変化させながら精度を評価した。結果として、今回利用したデータセットであれば、データ分布の違いよりもむしろ全体的な学習データの枚数が大きく影響していることが明らかとなった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年は研究立ち上げの年であったために計算機の調達や追加で行った開発環境の構築に時間を要した。来年度からは加速的に実施されることが期待できる。
|
今後の研究の推進方策 |
今後の研究推進方策は、データセットの変更と、さらにデータ分布やクライアント数、データサイズなどの関係性を明らかにすることである。今回事例適用的に行った車載カメラ画像は、連合学習のメカニズムを明らかにする上では応用的なデータセットであったために、細かな挙動について確認することができなかった。データセットを有名かつ基礎的なものに置き換え、同様に連合学習におけるクラスタリングを実施する予定である。
|