研究課題/領域番号 |
17H01730
|
研究機関 | 静岡大学 |
研究代表者 |
峰野 博史 静岡大学, 情報学部, 教授 (40359740)
|
研究分担者 |
水野 忠則 愛知工業大学, 情報科学部, 教授 (80252162)
|
研究期間 (年度) |
2017-04-01 – 2021-03-31
|
キーワード | モバイル / オフローディング / 深層強化学習 |
研究実績の概要 |
遅延耐性のあるモバイルデータ通信に対し,データの送受信タイミングを適切に制御することで,時間的,空間的,通信路的な3次元で空間利用効率を最大化させるモバイルデータ3Dオフローディング手法(MDOP)の確立を目指した.まず,MDOPの詳細特性評価に関して,特にUEの移動によるハンドオーバ時や,時間的と空間的を組合わせた際のMDOPアルゴリズムの詳細評価は条件が複雑になるため,空間利用効率の最大化可能な条件を段階的にネットワークシミュレーションで分析した.また,UEがどのような条件でどのようにデータ送信すれば,帯域利用効率を向上させつつeNB負荷を平滑化できるか,単純な条件設定を用いたネットワークシミュレーションへ深層強化学習の適用を進めた.評価の結果,既存のMDOPにおける時間的オフローディングに比べ,制御目標値からの超過データ量を最大26%削減できることを確認した. 一方,3GPPで検討が進められているトラフィックを効率よく収容するために広域をカバーするマクロセルと狭域をカバーするスモールセルを組合わせた最適化ネットワーク技術を想定し,遅延耐性ありUEに対してはeNBカバレッジを広くし積極的に低負荷なeNBへハンドオーバさせ,遅延を許容できないUEに対してはカバレッジを狭くし消極的なハンドオーバさせることで,ネットワーク全体のQoEを低下させない遅延耐性を考慮したハンドオーバ制御に基づくモバイルデータオフローディング手法を検討した.基礎評価の結果,遅延耐性を持たないUEの平均送信量を約2倍向上できることを確認し,UE送信レート制御によるモバイルデータオフローディングに加え,ハンドオーバ制御によっても効果的なモバイルデータオフローディング可能なことが明らかとなった.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
コンテンツが持つ遅延耐性に着目し,深層強化学習を用いることで,人手で構築された数理モデルでは制御が困難な状況においても適切な送信レート制御を行うモバイルデータオフローディング手法を検討した.まずは時間的オフローディングに対して深層強化学習の適用を検討し,DDQN (Double Deep Q-Network) を用いて,状態s(UE情報(コンテンツ遅延耐性時間,残データ量),接続中・周辺eNB情報(eNB負荷,QoS別UE数)),行動a(QoSレベル),報酬r(制御後の理想負荷に対する状況で算出)に対し行動価値関数Q(s,a)を最大化するよう学習を繰り返し,帯域利用効率を最大化する送信レート制御モデルの構築を行った.また,時間経過に伴い経時的に変化するトラフィックに対して,特徴量に時間情報を加えることで超過データ量を削減できることも確認でき,提案手法では制御目標値からの超過データ量を最大26%削減できることを示した.深層強化学習の適用によるUE送受信制御手法獲得の基礎評価など計画通り順調に進展している. 一方,UE送信レート制御によるモバイルデータオフローディングに加え,ハンドオーバ制御手法でも効果的なモバイルデータオフローディングが可能なことも確認できた.基礎評価の結果,ハンドオーバ制御手法を用いることでマクロセルでは受信しきれない負荷を,スモールセルへ分散できることだけでなく,遅延耐性ありUEを積極的に負荷分散に参加させることで,負荷分散で空いた帯域を遅延耐性なしUEへ割り当てることができ,遅延耐性なしUEの送信量を向上できることを明らかにした.
|
今後の研究の推進方策 |
引き続き深層強化学習の適用によるUE送受信制御手法獲得について発展的評価を進める.特に,UEモビリティモデルやeNB負荷モデル,トポロジモデルといった環境設定において,これまでの評価で得た時間情報を特徴量に加えることの有効性をふまえて学習パラメータに時系列特性を持たせるなど特徴量の与え方について研究を進める.より複雑かつ現実的な局面を想定するだけでなく,エージェント数の増加や強化学習方法の工夫も進め,既存MDOPにおけるオフローディング性能に対して詳細検証する. また,UE送信レート制御によるモバイルデータオフローディングに加え,ハンドオーバ制御手法でも効果的なモバイルデータオフローディングが可能なことも確認できたため,ハンドオーバ制御手法についても深層強化学習の適用を進め,カバレッジの頻繁な変動によって発生するPing-Pongハンドオーバの抑制を効果的に学習でき,既存手法を凌駕する性能を得られるか検討を進める.
|