研究課題/領域番号 |
18F18376
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 外国 |
審査区分 |
小区分60020:数理情報学関連
|
研究機関 | 広島大学 |
研究代表者 |
向谷 博明 広島大学, 工学研究科, 教授 (70305788)
|
研究分担者 |
RAMASAMY SARAVANAKUMAR 広島大学, 工学研究科, 外国人特別研究員
|
研究期間 (年度) |
2018-11-09 – 2021-03-31
|
研究課題ステータス |
交付 (2019年度)
|
配分額 *注記 |
2,100千円 (直接経費: 2,100千円)
2019年度: 900千円 (直接経費: 900千円)
2018年度: 400千円 (直接経費: 400千円)
|
キーワード | マルチエージェントシステム / インセンティブシュタッケルベルグゲーム / むだ時間確率リアプノフの安定性理論 / マルチエージェント / シュタッケルベルグ戦略 / パレート最適性 / 出力フィードバック |
研究実績の概要 |
本年度は, マルチエージェントシステムに対する合意形成制御の問題に基づいて,誘因型階層戦略であるインセンティブシュタッケルベルグゲーム理論に基づく安定性に関する条件導出を行った.まず,マルチエージェントシステムの合意形成制御の分野における重要な話題として,ドローンの協調制御への応用を考慮した.特に,局所的な位置・速度・加速度といった多変数状態値,及び時間遅れを伴う数理モデルの選定に関して,議論を行った.マルチエージェントシステムにおいて,状態値よりより現実的である出力値を基盤とした近傍の情報だけを使用する制御則によって同じ状態値に収束させることを目標とし,情報伝達の遅れを忠実に表現可能な大規模むだ時間系のシステムを選択することにした.さらに,天候の影響などシステムにおける確率ノイズとみなされる外乱を具体的にモデル化するために,伊藤の確率微分方程式に基づく確率システムの適用を行うことにした.後半では,むだ時間確率リアプノフの安定性理論を基盤として,インセンティブシュタッケルベルグゲーム理論の優位な特徴を考慮し,下位層では, 協力戦略であるパレート準最適性,もしくは非協力ゲームであるナッシュ均衡論による比較検討も行った.これらの提案された戦略の顕著な利点は,所望の均衡状態へ少ない遅延情報で誘引することができることである.さらに,戦略を数値計算によって求めることが容易な点である.後に,提案された戦略の有用性の比較検討を行うために,ドローンの協調制御の他に,幾つかの実際的工学的問題に対して,マルチエージェントシステムの合意形成制御戦略の適用を試みた.その結果,ある一定の条件を満足すれば,均衡状態に誘引することが可能であることが確認された.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
通常,フィードバック機構を伴うマルチエージェントシステムでは,情報伝達の遅延や予期せぬ外乱が影響しても,最低限制御に必要な状態値の取得によって,合意形成制御の成功に導くことが大きなポイントとなる.現在まで,むだ時間確率システムを基盤とした静的出力フィードバックによる合意形成戦略に基づくマルチエージェントシステムの制御戦略構築に成功している.さらに,単一階層でのパレート準最適戦略やナッシュ均衡戦略のみならず,階層戦略であるインセンティブシュタッケルベルグ戦略の理論構築が完了している.特に,戦略を計算するための数値計算アルゴリズムの理論的検証も終了している.一方,マルチエージェントシステムでは,シミュレーションが大規模になりがちであるが,GPUを搭載したワークステーションで実施できるよう,機械学習などの利用により,現実により即したシミュレーションが行えるように準備も取り掛かっている.以上の進捗状況から,概ね順調に進んでいると考えられる.
|
今後の研究の推進方策 |
引き続き,静的出力フィードバック戦略に基づくマルチエージェントシステムの合意形成制御戦略の有用性検証を行う.一方,GPUを搭載したワークステーションによるシミュレーションのためのシミュレータ作成にもとりかかる.特に,機械学習に基づく理論によって,研究室内であっても大規模シミュレーションが可能なように,実際のマルチエージェントシステムの挙動解析を行う.また,GPU上でも,制御系設計ソフトウェアであるMATLABにコードが実行できるように,ソフトウェア環境を整える.最後に,人工知能によって再現されたシミュレータによるシミュレーションデータから,得られた新インセンティブシュタッケルベルグ均衡戦略の有用性の評価・検討を行う.
|