研究課題/領域番号 |
23K24903
|
補助金の研究課題番号 |
22H03647 (2022-2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2022-2023) |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 神戸大学 |
研究代表者 |
平山 勝敏 神戸大学, 海事科学研究科, 教授 (00273813)
|
研究分担者 |
沖本 天太 神戸大学, 海事科学研究科, 准教授 (10632432)
松井 俊浩 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (60437093)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
16,640千円 (直接経費: 12,800千円、間接経費: 3,840千円)
2024年度: 3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
2023年度: 4,940千円 (直接経費: 3,800千円、間接経費: 1,140千円)
2022年度: 8,060千円 (直接経費: 6,200千円、間接経費: 1,860千円)
|
キーワード | 分散最適化アルゴリズム / 深層強化学習 / 分散衝突回避 |
研究開始時の研究の概要 |
集団を構成するエージェントのパフォーマンスが集団全体および個々のエージェントの両者にとって最適なものとなるように、各エージェントが互いの相互作用の仕方を深層強化学習という最新の技術を使って学習する。その一つの応用例として船舶などの自律移動体による自動衝突回避の問題を取り上げ、当初は「ぎこちなく」交差していた移動体が学習過程を経て「賢く」交差できるようになることを実験等で示す。また、ここでの基本的なアイデアがより広い文脈に適用できることを示す。
|
研究実績の概要 |
(1) 分散船舶衝突回避アルゴリズムDSSQの各エージェントのコスト関数における針路変更および速度変更の項の重みを調整するパラメータαの設定値(学習アルゴリズムの行動空間に相当)を2通り、3通り、5通り用意した場合の評価実験を行った。その結果、行動空間のサイズが大きくなるにつれ、学習後のエージェントが目標地点に到達するまでの平均所要時間に有意な差は見られなかったが、エージェント間の所要時間の分散については大きく減少することが分かった。当該結果を追記した論文を新たに作成し、可能な限り最終年度である2024年度中に公表したいと考えている。 (2) これまでに開発してきた分散船舶衝突回避アルゴリズムDSSA、DSSA+と最新アルゴリズムであるDSSQの概要を紹介する招待講演を2件行った。1件は国際会議9th International Conference on Advanced Intelligent Maritime Safety and Technologyにおける基調講演、もう1件は2023年度人工知能学会全国大会(第37回)OS-9「AIと制約プログラミング」における招待講演である。 (3) 船舶運航において、各船舶の行動を示すAISデータから異常行動を検知するためのクラスタリングアルゴリズムおよび深層学習アルゴリズムに関する研究を指導学生とともに行い、論文として発表している。それに対する質問対応等のフォローアップを行った。なお当該論文は、Clarivate Analytics社のInCitesにおいて2023年のTop10%論文の一つとしてカウントされている。 (4) その他関連する研究課題として、ビールゲームにおけるマルチエージェント深層強化学習手法、マルチエージェント集配問題の解法の改良、平等性を指向したリーグ戦作成に関する研究に取り組み、それぞれ関連する学会誌および研究集会等で成果発表を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
昨年度初めに船舶海洋系の国際学術誌に投稿していた論文が1回の照会を経て、残念ながら実用面での課題が残るとのことで今年3月に不採択との結果となった。一方、この間に並行して行っていた実験の結果は、全体最適をほぼ維持したまま学習により個人最適を目指すという我々のアプローチの有効性を示すものとなっており、データは概ね出揃ったと考えている。従って、前年度不採択となった論文に新規の結果を追記して最終年度である2024年度にブラッシュアップしていけば、内容的に論文の投稿先を慎重に選ぶ必要はあるが、採択に結びつく可能性は高いと考えている。
|
今後の研究の推進方策 |
当初計画では、分散衝突回避を題材として全体最適と個人最適を両立させるアプローチの有効性を確認し、さらにそれを別の分散問題解決に適用することを考えていた。しかしながら、本計画の初年度に購入したGPUサーバーを用いたとしても分散衝突回避アルゴリズムにおける学習の効果を評価する実験にかなりの時間がかかることが分かったため、今後はポイントを絞ってできる限り分散衝突回避の問題にエフォートを集中したいと考えている。
|