1995 Fiscal Year Annual Research Report

同型性に基づく抽象化プランニングのロボットの行動学習への応用

Research Project

Project/Area Number	07750460
Research Institution	Osaka University
Principal Investigator	山口智浩大阪大学, 基礎工学部, 助手 (00240838)
Keywords	人工知能 / 機械学習 / 問題解決 / 抽象化 / 同型性 / 強化学習 / ロボット学習 / 多様性
Research Abstract	本年度は、前年度の成果として得られた、状態の同型性を抽象化に利用する“同型性に基づく抽象化問題解決"を拡張し、状態空間の階層的な同型性を利用して、効率的に抽象化問題解決する方法を研究すると共に、一般的な分野への応用として、同型な機能、構造を持つロボットの行動学習として、同型性に基づく抽象化強化学習法を考案し、以下の研究を行った。 (1)状態空間の階層的な同型性の解析による、階層化抽象空間の生成同型性に基づく抽象化だけでは不十分な場合、抽象空間の階層的な同型性を利用すると、階層的な抽象空間を段階的に生成して、より小さな抽象空間を求め、解析の計算コストを削減することができることを示した。 (2)効率的な抽象化プランニングと詳細化生成した階層的な抽象空間中に、初期状態と目標状態とを写像し、抽象空間における、初期状態と目標状態とを結ぶ状態遷移をプランニングにより求めて、抽象プランを効率よく探索できることを示した。 (3)ロボットの行動学習システムの構築現有の計算機と通信しながら学習するロボットの行動学習システムを構築した。シミュレーション学習と実環境での実ロボットとのハイブリッド強化学習システムを作成し、両者の学習システムを共通化することにより、仮想個体、実ロボット間での学習結果の交換を可能とした。学習法として、経験強化型のClassifier Systemを元にして、高速化の拡張を行い、従来困難だった実ロボットでの実時間強化学習を実現した。 (4)同型性に基づく強化学習法による、ロボットの多様な行動の獲得構築したロボットの行動学習システムを用いて、まずあるタスクで強化学習を行い、得た学習結果に対し、行為の同型性を利用した置換を組み合わせ的に施して同型な学習結果を生成し、学習結果のバリエーションの探索を行う。その結果、学習したタスクを達成する、同型な挙動や、学習タスクに似た、類似挙動など、従来の強化学習法では、得られない多様な行動を、効率的に獲得することができた。

Research Products
(5 results)

All Other

All Publications (5 results)

[Publications] Tomohiro Yamaguchi: "Learning Cooperative Behaviors with Spontaneous Mimetism" Proc.of 6th Int.Fuzzy Systems Association World Congress(IFSA-95). Vol.1. 101-104 (1995)
[Publications] 田中康祐: "実ロボットとシミュレータ・エージェントとの協調による行動学習システム" 第13回ロボット学会学術講演会. No.1. 457-458 (1995)
[Publications] 増渕元臣: "ロボットにおけるドリブル動作の実環境下での強化学習" 第13回ロボット学会学術講演会. No.1. 459-460 (1996)
[Publications] Tomohiro Yamaguchi: "Multi-agent Reinforcement Learning with Adaptive Mimetism" Proc.of 5th Int.Workshop on Artificial Life(ALife V)1996 at Nara,ATR,(poster accepted). (1996)
[Publications] Tomohiro Yamaguchi: "Propagating Leamed Behaviors from a Virtual Agent to a Physical Robot in Reinforcement Learning" Proc.of IEEE Int.Conf.on Evolutionary Computation(ICEC-96)at Nagoya,(accepted). (1996)

1995 Fiscal Year Annual Research Report

同型性に基づく抽象化プランニングのロボットの行動学習への応用

Principal Investigator

山口 智浩 大阪大学, 基礎工学部, 助手 (00240838)

Research Products

[Publications] Tomohiro Yamaguchi: "Learning Cooperative Behaviors with Spontaneous Mimetism" Proc.of 6th Int.Fuzzy Systems Association World Congress(IFSA-95). Vol.1. 101-104 (1995)

[Publications] 田中康祐: "実ロボットとシミュレータ・エージェントとの協調による行動学習システム" 第13回ロボット学会学術講演会. No.1. 457-458 (1995)

[Publications] 増渕元臣: "ロボットにおけるドリブル動作の実環境下での強化学習" 第13回ロボット学会学術講演会. No.1. 459-460 (1996)

[Publications] Tomohiro Yamaguchi: "Multi-agent Reinforcement Learning with Adaptive Mimetism" Proc.of 5th Int.Workshop on Artificial Life(ALife V)1996 at Nara,ATR,(poster accepted). (1996)

[Publications] Tomohiro Yamaguchi: "Propagating Leamed Behaviors from a Virtual Agent to a Physical Robot in Reinforcement Learning" Proc.of IEEE Int.Conf.on Evolutionary Computation(ICEC-96)at Nagoya,(accepted). (1996)

山口智浩大阪大学, 基礎工学部, 助手 (00240838)