Advancement of reinforcement learning and its applications to mobile robots based on spatio-temporal segmentation of the environment
Project/Area Number |
18500175
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Research Field |
Sensitivity informatics/Soft computing
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
ISHIKAWA Masumi Kyushu Institute of Technology, 大学院・生命体工学研究科, 教授 (60222973)
|
Co-Investigator(Kenkyū-buntansha) |
ZHANG Hong 九州工業大学, 大学院・生命体工学研究科, 助教 (30235709)
|
Project Period (FY) |
2006 – 2008
|
Project Status |
Completed (Fiscal Year 2008)
|
Budget Amount *help |
¥4,290,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥690,000)
Fiscal Year 2008: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2007: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
Fiscal Year 2006: ¥1,300,000 (Direct Cost: ¥1,300,000)
|
Keywords | 自己組織化 / 強化学習 / 知能ロボティクス / 分節化 |
Research Abstract |
追跡・逃避ゲームを対象とし、モジュール型ネットワーク自己組織化マップを用いたダイナミクス学習層により追跡逃避者間の距離の時間変化を学習し、追跡者・逃避者の最適制御をモジュール化した強化学習層により学習するという、統合的アーキテクチャを提案しその有効性を実証した。また環境が変化した場合、地図の各グリッドが占有されている、あるいは空であるという仮説の下での、センサー系列のそれぞれの尤度を求めることにより、環境変化を検出する方法を提案し、その有効性を実証した。
|
Report
(4 results)
Research Products
(69 results)
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Journal Article] Trends2007
Author(s)
Frederik Linaker
-
Journal Title
Neural Computation(Robot Localization Using Vision), Springer
Pages: 483-512
Related Report
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-