研究課題/領域番号 |
21K04531
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分25010:社会システム工学関連
|
研究機関 | 広島大学 |
研究代表者 |
向谷 博明 広島大学, 先進理工系科学研究科(工), 教授 (70305788)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2021年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | サイバーフィジカルシステム / インセンティブ可能性 / 平均場確率システム / むだ時間 / インセンティブ / 静的出力フィードバック / 半正定値計画法 / 大規模電力システム |
研究開始時の研究の概要 |
本研究では,サイバー空間(仮想空間)とフィジカル空間(現実空間)を高度に連携可能にするサイバーフィジカルシステム(CPS)におけるロバスト(頑強)大規模インセンティブ設計論について研究する.まず,インセンティブの存在性を判別できる「インセンティブ可能性」の概念を創成する.次に,部分観測値や時間遅れ等の不確定情報にロバストな大規模インセンティブ戦略設計アルゴリズムを確立する.最後に,スマートグリッドを基盤とする再生可能エネルギー需給安定化問題を取り上げ,提案された大規模インセンティブ誘導戦略の可用性・有用性及び,現実問題への信頼性・適用可能性の評価・検討を行う.
|
研究実績の概要 |
本年度は,サイバーフィジカルシステムにおいて,通信遅延等無視できない要素をむだ時間と捉え,静的出力フィードバック戦略に基づく平均場ゲームの導入を行った.まず,サイバーフィジカルシステムを平均場として表現し,平均場ゲーム理論の導入により,誘因戦略の事前結果として,集中制御戦略を導出し,これら戦略の存在条件の定式化を行った.特に,むだ時間が状態でなく入力に存在する場合,出力フィードバックでは,不可能であること.さらに,状態行列は正方行列でなければならないといったフィジカル空間における拘束条件を確認した.一方,状態のみにむだ時間が存在する場合,サイバー空間での戦略獲得を可能とするため,ニュートン法に基づく計算アルゴリズムの詳細を与えた.さらに,数値解を得るための注意事項について考察を行った.具体的には,まず,単一意志決定者に対する安定化問題を定義した後,コスト保障制御理論によって,評価関数の上限を最小化する問題を解いた.この問題に対して,KKT条件によって,大規模確率行列方程式を使用して準最適性を満足する必要条件を導出した.従来研究と異なり,フィジカル空間における拘束条件のため,静的出力フィードバック戦略は,対角ブロック構造を持つフィードバックゲインが仮定されることに注意されたい.続いて,多数の意思決定者を伴う平均場確率システムに対して,協力ゲームであるパレート最適戦略の適用を行った.主な貢献として,集中戦略を計算するために,ニュートン法の分解を行った.これらは,低次元化数値計算アルゴリズムによって実現可能である.さらに,勾配法による低次元化数値計算アルゴリズムによって得られた再帰的解を,ニュートン法の初期値として利用することにより,より高精度な解を得ることに成功したことを数値例で示した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
サイバーフィジカルシステムを平均場確率システムとして表現したとき,同時にフィジカル空間である実システム側に,通信遅延などのむだ時間の設定を新規に行った.その結果,インセンティブの事前導出において,サイバー空間での戦略存在条件の導出が新たに必要になったため,やや遅れが生じている.フィジカル空間でのむだ時間は,無視できない要素であり,かつ,インセンティブ可能性に綿密に関係しており,時間的損失は避けられないが,今後の実現性を考えれば,必要不可欠な理論構築であると考えられる.
|
今後の研究の推進方策 |
サイバーフィジカルシステムのシステム表現に対して,むだ時間の導入を行い,平均場ゲーム理論による戦略設計,および,インセンティブ存在条件の導出を行う.そこで,まず,平均場確率むだ時間システムにおけるインセンティブ設計を,昨年度得られた事前結果である戦略設計アルゴリズムの結果を利用して行う.さらに,平均場戦略だけでなくインセンティブも含め,全平均場の状態フィードバックでなく,ローカルな平均場に基づくフィードバック情報への拡張を考えている.従来,全平均場の状態を利用することは,そもそも実装が困難であり,かつ,コストが非常にかかることが知られている.そこで,ローカルな平均場の部分情報を用いることによって,実現性と有用性の両方を主張できると考えている.その他,現在の結果は,プレイヤーの数が無限であると仮定されているため,ローカルな戦略・インセンティブ設計に関する実用的な例がないことは,注意が必要である.したがって,現実のサイバーフィジカルシステムで検討することは重要である.また,今回の結果の信頼性を示すためには,現実的なシステム例を用いてこの問題を検討することが不可欠であると考えられる.したがって,実際にあるサイバーフィジカルシステムを基盤としたシミュレーションを実行する計画である.
|