2021 Fiscal Year Research-status Report
深層強化学習による行動戦略の獲得:企業の地震津波被害における復旧計画
Project/Area Number |
20K15001
|
Research Institution | The University of Tokyo |
Principal Investigator |
小川 芳樹 東京大学, 空間情報科学研究センター, 助教 (70794296)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | エージェントモデル / 深層強化学習 / 多目的最適化 / 復興戦略 |
Outline of Annual Research Achievements |
今年度は,当初の計画通り,企業をエージェントとして企業の属性情報(業種,取引先,取引額,資本など)を加味した行動を記述することでニューラルネットワークベースのエージェントモデルを構築した。エージェントモデルの行動には,設備復旧,労働資本の確保,取引行動,代替取引などを記述した。その上でマルチエージェント深層強化学習モデルに取り込むことで,発災から復興までの数理最適化シミュレーションを行うことが可能になった。この手法では,多くの特徴量を取り扱えるため,エージェントは時系列のサプライチェーンの動的変化の中,復旧を目指して特徴抽出と行動過程を学習し,サプライチェーン全体の生産能力の復旧過程に応じた最適な行動戦略の取得が概ね可能になった。具体的には,高知県をシミュレーションの対象としてサプライチェーン全体の復旧率の目標を被災前比で70%と設定しモンテカルロシミュレーションにより数100回計算した結果,9割以上のゲームで設定した目標に達成する行動戦略を獲得することが可能になった.モデル複数主体が関わる協力ゲームの意思決定の問題であるため,行動の相互依存的状況を細かに想定してモデル化した。またある災害対策を行った場合の効果を定量化するために,対策シナリオを用いた。ここでは,実験として耐震化を行うという対策シナリオを用意して,被害の大きさの違いにより,最適化行動をとった結果,転帰がどのように,またどのくらい異なるかを定量的に比較した。このように災害対策の有効性が分かることは,企業は限られた費用で効率的に対策を講じることが可能になると考えられる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度はコロナの影響も少なく、昨年度以上に年度を通じて計画通り進めることができた。
|
Strategy for Future Research Activity |
今後の研究推進方策は,今年度構築したエージェントモデルの検証と精緻化が挙げられる.具体的には,複数の災害を対象にシミュレーションを行うことで,発災から復旧過程事象をシミュレーション結果と過去の災害事象の両者企業行動戦略を横断的に眺め、一般性のある数理的考察をすることで検証する。またモンテカルロシミュレーションにより、結果が同程度ばらつくのか精度検証することで本開発技術の有用性を示す。
|
Causes of Carryover |
コロナにより会議がオンライン開催されたことで旅費について繰り越ししたため次年度利用額が発生した。その分昨年度、GPU購入に割り当てをした。残りの利用額は次年度の旅費として割り当てを行う。
|
Research Products
(9 results)