研究課題/領域番号 |
18H01442
|
研究機関 | 京都大学 |
研究代表者 |
山本 高至 京都大学, 情報学研究科, 准教授 (30423015)
|
研究分担者 |
守倉 正博 京都大学, 情報学研究科, 教授 (20467400)
西尾 理志 東京工業大学, 工学院, 准教授 (80711522)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
キーワード | 無線ネットワーク / ゲーム理論 / 確率幾何 / 強化学習 |
研究実績の概要 |
確率幾何・ゲーム理論・強化学習を融合させた、無線リソース制御技術の検討を行った。代表的な成果を以下に述べる。 強化学習の一つである多腕バンディットアルゴリズムを、無線環境の変化に追従させるためのコンテクスト付きバンディットの検討を行った。様々なコンテクスト付きバンディットアルゴリズムの比較評価を行うとともに、学習の高速化に役立つコンテクストの設計手法を提案した。 また、第5世代移動通信を視野に入れたミリ波帯は、周波数が高く、広帯域の確保が可能な一方、光と同じように直進性が強く、人体遮蔽に弱いという欠点がある。そこで、通信をしている状況を撮影した光学カメラ映像を機械学習することで、人体遮蔽を事前に予測しながら無線リソース制御が可能になるのではないかいう着眼で研究を進めており、2020年度は強化学習を用い、基地局を切り替えるハンドオーバの有効性の検証に成功した。 新たな課題として、機械学習を無線ネットワーク内で実行する際にプライバシに配慮したフェデレーテッドラーニングに適した無線リソース制御技術を検討した。フェデレーテッドラーニングとは、データによるモデルパラメータの更新を行う際、すべてのデータをユーザがサーバにアップロードして一括して行うのではなく、データはユーザが持ったまま、モデルパラメータの更新もユーザが行う方式である。これを無線ネットワークで行う際に情報共有を少なくするために電波信号振幅の重畳によって行う手法を提案した。 これらの成果をまとめた依頼チュートリアル講演を、電子情報通信学会総合大会で行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
COVID19の影響により口頭発表は少なめになったものの、2021年度に向けジャーナル論文の投稿を進めており、順調に進展していると言える。
|
今後の研究の推進方策 |
昨年度に引き続き、確率幾何・ゲーム理論・強化学習を融合させた、無線リソース制御技術の検討を行う。 多数の無線局が同時にチャネルを選択する状況では、ゲーム理論を用いた解析により、チャネル選択がループし、収束しないことが知られている。文脈付きバンディット学習においてループによるペナルティを学習できるようにすることで、周囲の環境を加味しつつ、チャネル割当におけるループの発生を抑止する機構の導入に取り組む。 強化学習を用いたミリ波ハンドオーバにおいては、分散ヘテロモーダル学習の導入により、情報共有を少なくするための無線方式を検討する。
|