2022 Fiscal Year Annual Research Report
Project/Area Number |
22H03647
|
Allocation Type | Single-year Grants |
Research Institution | Kobe University |
Principal Investigator |
平山 勝敏 神戸大学, 海事科学研究科, 教授 (00273813)
|
Co-Investigator(Kenkyū-buntansha) |
沖本 天太 神戸大学, 海事科学研究科, 准教授 (10632432)
松井 俊浩 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (60437093)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | 分散最適化アルゴリズム / 深層強化学習 / 分散衝突回避 |
Outline of Annual Research Achievements |
2022年度の本計画においては、主に以下の活動を行った。 (1) 分散船舶衝突回避アルゴリズムDSSQに関する基本的な評価実験を行い、2023年3月末に船舶海洋系の国際学術誌に投稿した。 (2) その他、関連する研究課題として、多目的なコンテナ船積み付け計画問題、提携形ゲームにおける利得分配問題、マルチエージェント集配問題に関する研究に取り組み、それぞれ関連する学会誌および研究集会等で成果発表を行った。 また、2023年度繰越分においては、以下の通り関連文献の調査と資料収集を行った。 (3) 分散船舶衝突回避アルゴリズムDSSQにおいて、将来的に使用する可能性のある強化学習アルゴリズムに関する関連文献の調査と資料収集を行った。現在、複数のエージェントがすべて独立に学習して実行する方式を採用しているが、将来的に学習については全体集中型で行い、学習結果を実行に移す段階では分散して実行する方式を採用したいと考えている。そのための準備として、現在の方式での実験を進めることと並行して、最近のマルチエージェント強化学習の知見を取り入れた新しい分散船舶衝突回避アルゴリズムの可能性を幾つか検討している。 (4) 分散船舶衝突回避アルゴリズムでは、エージェントは互いの「意図」を事前に調整し、最終的に合意された「意図」を実世界において実行するが、現実には波や風などの外乱の影響でその実行結果が「意図」した通りにならない場合があり得る。この問題を解決するべく、関連文献の調査および資料収集を行なって実行可能なアプローチを幾つか検討している。そのような不確実性を吸収するために、現在、まずは簡単なサンプリングベースのアルゴリズムを考案し、その実装を開始した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
主要設備として購入したGPUサーバーの納品が、設置場所の改修工事の影響により2022年度末となり予定していた計算機実験を代替手段により実施した。かなりの時間を費やしたが、一通りの結果は出たため、おおむね順調と判断した。
|
Strategy for Future Research Activity |
強化学習の高度化に関しては、マルチエージェント強化学習を専門とする専門家の知見を得るべく外部講師等による講演会等を企画することを検討中である。また、実用面での課題を解決するために流体力学等の知見を取り入れるべく部局内の専門家のアドバイスを得ることも検討している。
|
Research Products
(9 results)