研究課題/領域番号 |
15H04008
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
笠原 正治 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (20263139)
|
研究期間 (年度) |
2015-04-01 – 2019-03-31
|
キーワード | 協調メカニズム / コグニティブ無線 / 機械学習 / ゲーム理論 / データ構造 |
研究実績の概要 |
本年度は機械学習の一手法である多腕バンディット問題アルゴリズムを用いた最適グループ構成手法と,複数プライマリ・ユーザが存在する環境下で協調センシングを行うための合併・分離アルゴリズムについて検討を行った. コグニティブ無線では,周波数帯の二次利用者(SU)が一時利用者(PU)の通信を正確にセンシングすることが重要な課題であり,高精度なセンシングを実現する手法の一つに,複数の SU がグループを形成してセンシング結果を共有する協調センシングと呼ばれる手法がある.適切な協調グループの形成には,個々のSUの誤検知率,誤警報率などの情報が必要となる.ここでは誤警報率はグループ形成の始めの時点で未知とする問題設定を考え,この問題を多腕バンディット問題として定式化し,探索と活用のトレードオフを考慮しながらSU自身がグループ形成の試行錯誤を繰り返すことで最適なグループ構成を学習する手法を提案し,シミュレーション実験により提案手法の有効性を評価した. 次に,自律分散型協調制御の代表的アルゴリズムとして知られている合併・分離 (Merge-Split) アルゴリズムについて研究を行った.既存研究では,1 PU 型コグニティブ無線における協調センシングのための SU 間グループ形成手法が提案されているが,実システムでは 二つ以上の PU が存在する可能性がある.ここでは,複数 PU 型コグニティブ無線における合併・分離アルゴリズムに基づく SU 間グループ形成手法を提案した.2 PU 環境を想定したシミュレーション評価により,提案手法を用いることで,非協調センシングと比べて PU のチャネルを利用できる SU (Winning SU) の割合を改善できること,また Winning SU の総スループットを迅速に理論値付近まで達成できることを確認した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
機械学習に基づく自律分散型グループ形成手法については当初,部分観測マルコフ決定過程(POMDP)を応用しようと計画していたが,グループ形成問題における状態遷移を特徴付けることが困難であったため,問題設定を簡単化して多腕バンディット問題アルゴリズムを応用できる形にすることで,自律分散グループ形成手法の初期検討を行うことができた.本検討では誤検知確率向上のみを考慮したため,得られたグループの間で誤検知確率の精度に大きくばらつきが生じていた.今後は全体のスループット向上を目的関数に含めることで,全体の最適性能を達成するグループ形成手法を検討する予定である. ゲーム理論に基づくグループ形成アルゴリズムについては,複数のPUが存在する状況下で機能する合併・分離アルゴリズムを新たに提案し,計算機シミュレーションにより,その有効性を確認することができた.
|
今後の研究の推進方策 |
次年度は主に次の二点について検討を進める予定である. 状態探索空間のデータ構造を工夫した高速最適化アルゴリズムの検討:多腕バンディット問題で定式化した問題に対するアルゴリズムは,考慮している状態の数や行動の種類が多くなると,最適方策を導出するための計算量が爆発的になることが知られている(次元の呪い).ここでは状態空間をコンパクトに表現可能なゼロサプレス型二分決定グラフ(Zero-suppressed Binary Decision Diagram: ZDD)等のデータ構造を応用し,周波数の使用状況や隣接端末の有無等の状態,協調グループへの参加・離脱や周波数帯域の獲得・解放等の行動を表現するZDDの応用法の検討と準最適解導出のための計算アルゴリズムについて研究を展開する. しっぺ返し戦略に基づく協調グループ形成メカニズム:合併・分離アルゴリズムは無線端末が自身の判断で協調グループに加入したり離脱したりする利己的なアルゴリズムである.ここでは情報提供に積極的でない無線端末はグループから除外されるしっぺ返し的なルールを取り込んだ合併・分離ベースの協調グループ形成メカニズムを考え,ゲーム理論による最適な協調グループへの収束性の解明,ならびにシミュレーションによるネットワークトポロジーや誤検知・誤警報確率の評価を行い,しっぺ返し戦略が無線端末のインセンティブに与える影響に対する知見の獲得を目指す.
|