Project/Area Number |
23K24903
|
Project/Area Number (Other) |
22H03647 (2022-2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2022-2023) |
Section | 一般 |
Review Section |
Basic Section 61030:Intelligent informatics-related
|
Research Institution | Kobe University |
Principal Investigator |
平山 勝敏 神戸大学, 海事科学研究科, 教授 (00273813)
|
Co-Investigator(Kenkyū-buntansha) |
沖本 天太 神戸大学, 海事科学研究科, 准教授 (10632432)
松井 俊浩 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (60437093)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥16,640,000 (Direct Cost: ¥12,800,000、Indirect Cost: ¥3,840,000)
Fiscal Year 2024: ¥3,640,000 (Direct Cost: ¥2,800,000、Indirect Cost: ¥840,000)
Fiscal Year 2023: ¥4,940,000 (Direct Cost: ¥3,800,000、Indirect Cost: ¥1,140,000)
Fiscal Year 2022: ¥8,060,000 (Direct Cost: ¥6,200,000、Indirect Cost: ¥1,860,000)
|
Keywords | 分散最適化アルゴリズム / 深層強化学習 / 分散衝突回避 |
Outline of Research at the Start |
集団を構成するエージェントのパフォーマンスが集団全体および個々のエージェントの両者にとって最適なものとなるように、各エージェントが互いの相互作用の仕方を深層強化学習という最新の技術を使って学習する。その一つの応用例として船舶などの自律移動体による自動衝突回避の問題を取り上げ、当初は「ぎこちなく」交差していた移動体が学習過程を経て「賢く」交差できるようになることを実験等で示す。また、ここでの基本的なアイデアがより広い文脈に適用できることを示す。
|
Outline of Annual Research Achievements |
(1) 分散船舶衝突回避アルゴリズムDSSQの各エージェントのコスト関数における針路変更および速度変更の項の重みを調整するパラメータαの設定値(学習アルゴリズムの行動空間に相当)を2通り、3通り、5通り用意した場合の評価実験を行った。その結果、行動空間のサイズが大きくなるにつれ、学習後のエージェントが目標地点に到達するまでの平均所要時間に有意な差は見られなかったが、エージェント間の所要時間の分散については大きく減少することが分かった。当該結果を追記した論文を新たに作成し、可能な限り最終年度である2024年度中に公表したいと考えている。 (2) これまでに開発してきた分散船舶衝突回避アルゴリズムDSSA、DSSA+と最新アルゴリズムであるDSSQの概要を紹介する招待講演を2件行った。1件は国際会議9th International Conference on Advanced Intelligent Maritime Safety and Technologyにおける基調講演、もう1件は2023年度人工知能学会全国大会(第37回)OS-9「AIと制約プログラミング」における招待講演である。 (3) 船舶運航において、各船舶の行動を示すAISデータから異常行動を検知するためのクラスタリングアルゴリズムおよび深層学習アルゴリズムに関する研究を指導学生とともに行い、論文として発表している。それに対する質問対応等のフォローアップを行った。なお当該論文は、Clarivate Analytics社のInCitesにおいて2023年のTop10%論文の一つとしてカウントされている。 (4) その他関連する研究課題として、ビールゲームにおけるマルチエージェント深層強化学習手法、マルチエージェント集配問題の解法の改良、平等性を指向したリーグ戦作成に関する研究に取り組み、それぞれ関連する学会誌および研究集会等で成果発表を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
昨年度初めに船舶海洋系の国際学術誌に投稿していた論文が1回の照会を経て、残念ながら実用面での課題が残るとのことで今年3月に不採択との結果となった。一方、この間に並行して行っていた実験の結果は、全体最適をほぼ維持したまま学習により個人最適を目指すという我々のアプローチの有効性を示すものとなっており、データは概ね出揃ったと考えている。従って、前年度不採択となった論文に新規の結果を追記して最終年度である2024年度にブラッシュアップしていけば、内容的に論文の投稿先を慎重に選ぶ必要はあるが、採択に結びつく可能性は高いと考えている。
|
Strategy for Future Research Activity |
当初計画では、分散衝突回避を題材として全体最適と個人最適を両立させるアプローチの有効性を確認し、さらにそれを別の分散問題解決に適用することを考えていた。しかしながら、本計画の初年度に購入したGPUサーバーを用いたとしても分散衝突回避アルゴリズムにおける学習の効果を評価する実験にかなりの時間がかかることが分かったため、今後はポイントを絞ってできる限り分散衝突回避の問題にエフォートを集中したいと考えている。
|
Report
(2 results)
Research Products
(20 results)