2021 Fiscal Year Research-status Report
A New Development of Robust Large-Scale Incentive Design for Cyber-Physical Systems
Project/Area Number |
21K04531
|
Research Institution | Hiroshima University |
Principal Investigator |
向谷 博明 広島大学, 先進理工系科学研究科(工), 教授 (70305788)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | サイバーフィジカルシステム / インセンティブ / 平均場確率システム / 静的出力フィードバック |
Outline of Annual Research Achievements |
当該年度では,サイバーフィジカルシステムをモデル化するにあたり,平均場確率システムの導入を行った.さらに,大規模インセンティブ設計問題に対して,一般化を行うため,評価関数の凸性の仮定を導入せず,インセンティブ設計に必要な理論構築を行った.すなわち,二次評価関数の重み行列の正定性を仮定しない問題を対象とし,インセンティブが存在するための条件の定式化を行った.一方,本研究で対象とするサイバーフィジカルシステムには,多数のプレーヤが含まれていることを想定している.したがって,各プレーヤに対して,すべての観測値が利用できるという仮定は課していない.その結果,戦略の基盤は,静的出力フィードバック戦略となっている.通常の状態フィードバック戦略に基づく設計とは異なり,この場合,不等式制約を伴う非線形最適化に基づく設計が必要となる.また,従来研究と異なり,非線形行列不等式による最適化条件の記述,さらに,インセンティブ存在条件の具体的定式化が必要となる.その結果,KKT条件を利用することにより,大規模連立型行列方程式による可解条件導出に成功した.さらに,インセンティブ設計には,これらの大規模連立型行列方程式を解く必要がある.過去,同じ問題が著者らによって解かれたが,必要条件しか考慮されておらず,さらに,戦略を計算するための具体的アルゴリズムが示されていない.さらに,過去の研究では,状態フィードバックのみ利用されているため,実際の静的出力フィードバック戦略の獲得という観点では,内容が不十分であった.そこで,インセンティブが存在するための必要十分条件を新規に導出した.さらに,確率リカッチ・リアプノフ方程式に基づく低次元化可能数値計算アルゴリズムの開発に成功した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
静的出力フィードバック戦略によるインセンティブ設計問題を扱った.従来研究と比較して,評価関数の凸性を仮定しない問題に対して,サドルポイント均衡戦略が存在する必要十分条件を新規に導出した.さらに,従来提案されているアルゴリズムの欠点を指摘した.数値実験では,従来の手法では最適性が確保されないことを示した.また,確率リカッチ・リアプノフ方程式に基づく低次元化可能数値計算アルゴリズムの開発に成功した.特に,ニュートン法と,従来のアルゴリズムに改良を加えた新規アルゴリズムの融合によって,アルゴリズムの実行に必要な初期値の探索を必要とせず,さらに局所二次収束を保証する新規なアルゴリズムを提案した.その結果,所望のインセンティブを得るまでの手順の削減,メモリーなどの計算機資源の低減を実現することに成功した.特に,初期値探索の回避,収束時間の短縮に成功した.以上の点から,順調に進展していると判断できる.
|
Strategy for Future Research Activity |
現在まで,協力ゲームにおけるパレート最適性に関連する結果について,議論を行った.今後は,非協力ゲームに焦点を当て,平均場確率システムのナッシュ戦略における,静的出力フィードバック戦略の導出,さらに,インセンティブ設計論について議論を行う予定である.特に,本研究の中心をなすインセンティブの存在条件,すなわち,本研究課題の重要な位置を占めるインセンティブ可能性について,詳細に研究を行う予定である.その他,すべてのプレーヤにおける集中型戦略の設計だけでなく,分散型近似低次元ナッシュ戦略構築にも焦点を当てる.これは,サイバーフィジカルシステムを扱う上で,回避しなければならない高次元化による欠点を克服することが期待される.具体的には,弱結合システム理論を適用することによって,近似インセンティブ戦略設計を行い,集中型戦略セットと分散型戦略セットの間のコスト機能の低下の程度を明らかにする.従来の結果とは異なり,近似インセンティブ戦略により,O(1/N)が達成されることを証明することが目的となる.ここで, Nはサイバーフィジカルシステムに存在するプレーヤ数であり,十分大きな自然数であると仮定される.この結果が示されれば,従来研究と比較して,よりタイトな評価を提供できると推測される.その物理的解釈として,Nが十分大きければ,近似インセンティブによって,集中型戦略とほぼ同程度の誘導効果を発揮できることが示される.
|
Causes of Carryover |
当初予定していた情報収集,並びに成果発表のための国際会議参加が,すべてコロナの影響でオンライン参加となった.その影響で旅費が大幅に減少した.今年度の使用計画として,プログラム作成,シミュレーションのデータ収集等に必要な謝金を大幅に増やす計画である.
|