2019 Fiscal Year Annual Research Report
Space-Time Interaction Design: Fusion of Stochastic Geometry and Game Theory
Project/Area Number |
18H01442
|
Research Institution | Kyoto University |
Principal Investigator |
山本 高至 京都大学, 情報学研究科, 准教授 (30423015)
|
Co-Investigator(Kenkyū-buntansha) |
守倉 正博 京都大学, 情報学研究科, 教授 (20467400)
西尾 理志 京都大学, 情報学研究科, 助教 (80711522)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | 無線ネットワーク / ゲーム理論 / 確率幾何 / 強化学習 |
Outline of Annual Research Achievements |
確率幾何・ゲーム理論・強化学習を融合させた、無線リソース制御技術の検討を行った。代表的な成果を以下に述べる。 強化学習においては、各無線チャネルにおける環境情報の把握が必要である。その一方、電波干渉などをより正確に把握するために長時間にわたって測定すると、品質の低いチャネルを使い続けることになる。そこで、強化学習の一つである多腕バンディットアルゴリズムに、確率幾何解析で得られた干渉の分布に関する知見を導入することで、少ない観測でより干渉の少ないチャネルの探索ができることを明らかとした。 また、深層強化学習による無線リソース制御において、環境情報として無線局の接続性を用いる際に有効と考えられるグラフ畳み込みを用いた特徴抽出の検討を行った。単純に深層強化学習を無線リソース制御に適用した場合、学習に時間がかかったり、上手く学習が進まないことが多いことが分かったため、グラフ畳み込みや選択的リプレイバッファリングなどの手法を適用することで、高速な学習が可能なことを明らかとした。 加えて、第5世代移動通信を視野に入れたミリ波帯は、周波数が高く、広帯域の確保が可能な一方、光と同じように直進性が強く、人体遮蔽に弱いという欠点がある。そこで、通信をしている状況を撮影した光学カメラ映像を機械学習することで、人体遮蔽を事前に予測しながら無線リソース制御が可能になるのではないかいう着眼で研究を進め、実際に基地局を切り替えるハンドオーバの実装に成功した。 これらの成果をまとめたチュートリアルが、IEEE通信ソサイエティのフラッグシップカンファレンスであるIEEE ICC 2019に採択され、研究代表者・研究分担者が講演を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
ジャーナル論文5件が採録されており、現在も1件投稿準備中であり、当初予定以上の進捗と言える。
|
Strategy for Future Research Activity |
昨年度に引き続き、確率幾何・ゲーム理論・強化学習を融合させた、無線リソース制御技術の検討を行う。 特に強化学習の一つである多腕バンディットアルゴリズムを、無線環境の変化に追従させるためのコンテクスト付きバンディットの検討を行う。様々なコンテクスト付きバンディットアルゴリズムの比較評価を行うとともに、どのようなコンテクストが学習の高速化に役立つかを明らかにする。また、多数のエージェントが強化学習による無線リソース制御をを同時に実行する状況のゲーム理論的な解析を進める。 新たな課題として、機械学習を無線ネットワーク内で実行する際にプライバシに配慮したフェデレーテッドラーニングに適した無線リソース制御技術を検討する。フェデレーテッドラーニングとは、データによるモデルパラメータの更新を行う際、すべてのデータをユーザがサーバにアップロードして一括して行うのではなく、データはユーザが持ったまま、モデルパラメータの更新もユーザが行う方式である。これを無線ネットワークで行う際に情報共有を少なくするための無線方式、ならびにそのための無線リソース制御手法を検討する。
|
Research Products
(26 results)