研究課題/領域番号 |
17K00136
|
研究機関 | 東京理科大学 |
研究代表者 |
長谷川 幹雄 東京理科大学, 工学部電気工学科, 教授 (50358967)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 機械学習 / ニューラルネットワーク / サポートベクトルマシン / 無線LAN / コグニティブ無線 / Multi-Armed Bandit問題 / 強化学習 / IoT |
研究実績の概要 |
様々な種類の端末が多数接続する無線ネットワークにおいては,自律分散型の通信プロトコルが用いられる.自律分散型ネットワークの性能を高めていくためには,個々の無線機が自律的に最適な動作を決定できるようにする必要がある.本研究では,各無線機が機械学習によって最適な動作を自律的に学習する方式を提案する.コンピュータシミュレーションだけでなく,実装評価まで行うことによって,提案手法の実現性と有効性を明らかにしていく. 本研究二年目は,強化学習による自律分散型アルゴリズムにおいて,多くの成果が得られた.本研究初年度において,無線リソース選択問題をMulti-Armed Bandit問題として定式化し,さらに,Tog-of-War(ToW)アルゴリズムによって最適化できることを示した.今年度は,このアルゴリズムを,IoTにおける自律分散型チャネル選択に応用した.センサなどに用いる小型IoT機器は,限られた計算能力,限られた電力で長期間動作することが要求される.本研究で用いるToWアルゴリズムは計算量が少なく,IoT機器への実装が可能である.本年度は,このアルゴリズムをWi-SUN無線デバイスに実装し,無線チャネル選択に応用した.IoT実機による評価実験によって,最適なチャネル選択が可能となることを確認した.さらに,IoTデバイス数が多い場合においては,各チャネルや各アクセスポイントの負荷分散も可能であることを示した.この研究成果を国際会議で発表し,Best Paper Awardを受賞した.現在は論文投稿の準備を進めている.さらに,ヘテロジニアスネットワークの選択にも同様の強化学習アルゴリズムを応用し,論文を執筆し投稿した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
当初の計画では,無線LANなどへの応用を中心にシミュレーションおよびパソコンによる実験を行う予定であったが,今年度はIoT機器への実装と実証実験を試みた.簡易な強化学習アルゴリズムであるToWを用いることによって,小型IoT機器に自律分散型チャネル選択アルゴリズムを搭載することができた.小型シングルボードマイコンへの実装に成功し,Wi-SUNを使った実験によって提案手法の有効性を実証することができた.この成果は,国際会議において,Best Paper Awardを受賞した. また,次年度の目標としている自律分散型MACプロトコルの開発も既に始めている.今年度と同様な強化学習を用いたアルゴリズムは設計がほぼ完了し,簡易的な実装によって動作の確認も始めることができている.当初の計画以上に進展しており,次年度以降の成果も期待できる.
|
今後の研究の推進方策 |
本研究一年目は,様々な観測データが取得可能であることを前提として機械学習アルゴリズムを用いた性能推定を行い,細かな推定値に基づいた意思決定の最適化手法を提案した.一方,本研究二年目は,意思決定の結果のみをフィードバックする強化学習アルゴリズムを用い,IoT機器の自律分散型チャネル選択最適化も可能とした.今後の研究ではこの二つの学習アルゴリズムを組み合わせ,様々な観測データが取得可能な状況では観測データを用いた推定を行い,十分な観測データが得られない状況では強化学習を活用する手法を実現することを試みる.対象とすべき無線ネットワーク構成を明確に定義しながら,適切な推定手法や最適化手法を設計していく.コンピュータシミュレーションによる評価だけでなく,パソコンやIoT機器を用いた実装,および,実際に無線通信を用いた評価も行っていく.様々な無線通信環境での実験評価を行うことにより,提案手法の有効性を検証していく.
|
次年度使用額が生じた理由 |
333,284円の次年度使用額が生じたが,物品購入額および旅費が当初計画よりも低く抑えられたためである.昨年度の実験では,慎重に実装を進めるために,機器の数を抑えた小規模な実験を行うことにした.今年度は,前年度までの実験で有効性を確認したアルゴリズムを,より多くのIoT機器に実装して有効性を実証する.そのため,前年よりも多くの実験用無線機器を購入する予定としている.
|