研究課題/領域番号 |
21K17807
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 岡山大学 |
研究代表者 |
上野 史 岡山大学, 環境生命自然科学学域, 助教 (30880687)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2022年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2021年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
|
キーワード | マルチエージェントシステム / 強化学習 / ニューラルネットワーク / 未知環境 / 知識 / 知識転移 |
研究開始時の研究の概要 |
本研究では,ロボットなどの活動主体(エージェント)が複数存在するときの協調制御ルールを,周囲環境から得た情報から各々が学習するマルチエージェント強化学習において,学習すべき協調や環境が未知であるときに適応した協調行動学習法を提案する.具体的には,他の環境などで今まで学習したエージェントの学習結果を各要素に分割し,階層的に抽象化することで生成した知識を組み合わせて学習することで未知の協調・環境に適応する.
|
研究成果の概要 |
本研究では、未知の協調および環境に対する効率的な知識利用法とそれを利用したマルチエージェント強化学習の方法論を明らかにし、その効果を実験によって実証した。具体的には、環境情報をニューラルネットワークによって抽出し、それを利用した木構造による関数を知識モジュールとして提案し、木構造の関数の枝葉を繋ぎ換えそしてパラメータを強化学習により最適化することで未知の協調および環境に適応した。なお、本研究の成果は英文ジャーナル1件、国際会議2件、招待講演1件、国内学会4件の発表により報告している。
|
研究成果の学術的意義や社会的意義 |
本研究は、構造型メタ知識に基づくマルチエージェント学習という従来の研究領域に対して、要素型メタ知識を扱えるように拡張することから、学術的観点から見ると新たな研究領域を開く位置づけとなり、学術的意義が大きい。更に、この基盤技術が確立すれば、ロボットの学習結果を未知問題に転移可能となることから、複数の災害救助ロボットや宇宙探査機による問題解決が可能となる。また、災害救助ロボットで得た学習結果が宇宙探査機に活用可能となるなど、知識の相互利用が可能となるため、産業的意義そして社会的意義も極めて大きい。
|