| Project/Area Number |
23K24926
|
| Project/Area Number (Other) |
22H03670 (2022-2023)
|
| Research Category |
Grant-in-Aid for Scientific Research (B)
|
| Allocation Type | Multi-year Fund (2024) Single-year Grants (2022-2023) |
| Section | 一般 |
| Review Section |
Basic Section 61050:Intelligent robotics-related
|
| Research Institution | Osaka University |
Principal Investigator |
OZTOP Erhan 大阪大学, 先導的学際研究機構, 特任教授(常勤) (90542217)
|
| Project Period (FY) |
2022-04-01 – 2025-03-31
|
| Project Status |
Completed (Fiscal Year 2024)
|
| Budget Amount *help |
¥14,950,000 (Direct Cost: ¥11,500,000、Indirect Cost: ¥3,450,000)
Fiscal Year 2024: ¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2023: ¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2022: ¥6,240,000 (Direct Cost: ¥4,800,000、Indirect Cost: ¥1,440,000)
|
| Keywords | Continual Robot Learning / Multi-task Learning / Task switching / Learning Progress / Energy Regulation / Symbol Formation / Intrinsic Motivation / Cognitive Robotics / 計算エネルギーコスト / 継続的な行動学習 / 概念形成 / 内発的動機 / スキル移転 / Lifelong Robot Learning / Knowledge Transfer / Multitask Learning / Interleaved Learning |
| Outline of Research at the Start |
生物にはエネルギーコストの制限があり,生涯を通じて効率的で有用な行動の学習と発達を可能にする.この制約は,ロボットにおいては,計算エネルギーコスト(CEC,computational energy cost)制約に対応すると考えられるが,ヒトと同様にこの制約がロボットの継続的な行動学習・発達にどのようにうまく機能するかが,本研究のテーマである.これを検証するために,ロボットの行動学習・発達機構として三層構造(エネルギーコスト最小化するニューラルネットワーク, CEC基づいた内発的動機, 概念形成)を想定する.各層でこの制約に基づく計算手法をロボットに実装され,ヒトに類似した学習行動が生成する.
|
| Outline of Final Research Achievements |
The project aims to develop mechanisms for multitask learning that resemble human learning, with a focus on computational efficiency. The scope was extended to address related challenges, including human-like reinforcement learning, active learning to reduce learning cost, and robot learning in social contexts where trust relates to energy savings. Key achievements include: (1) Generalizing skill transfer to be bidirectional, removing fixed source-target task roles; (2) Proposing an interleaved learning scheme enabling lifelong learning without fixed task order; (3) Developing a deep learning model with attention and energy-modulated learning progress (EMLP), achieving better multitask performance; (4) Designing a multitask RL framework with human-like interleaved learning and bidirectional skill transfer; (5) Introducing neuro-symbolic architectures to reduce planning cost; (6) Proposing prediction uncertainty as an intrinsic motivation signal to enhance sample efficiency.
|
| Academic Significance and Societal Importance of the Research Achievements |
本研究は、「学習進捗」と「神経的エネルギー」のバランスを取る人間類似のタスクスイッチング機構を導入することで、マルチタスク学習の性能向上と神経的コストの削減を両立させた点に学術的意義がある。 本プロジェクトの成果は、ロボットが自律的に「何を・いつ学習すべきか」を判断可能とすることにより、人間とロボットが共生する社会の実現に向けた基盤を築くものである。
|