• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

同型性に基づく抽象化プランニングのロボットの行動学習への応用

研究課題

研究課題/領域番号 07750460
研究種目

奨励研究(A)

配分区分補助金
研究分野 システム工学
研究機関大阪大学

研究代表者

山口 智浩  大阪大学, 基礎工学部, 助手 (00240838)

研究期間 (年度) 1995
研究課題ステータス 完了 (1995年度)
配分額 *注記
1,000千円 (直接経費: 1,000千円)
1995年度: 1,000千円 (直接経費: 1,000千円)
キーワード人工知能 / 機械学習 / 問題解決 / 抽象化 / 同型性 / 強化学習 / ロボット学習 / 多様性
研究概要

本年度は、前年度の成果として得られた、状態の同型性を抽象化に利用する“同型性に基づく抽象化問題解決"を拡張し、状態空間の階層的な同型性を利用して、効率的に抽象化問題解決する方法を研究すると共に、一般的な分野への応用として、同型な機能、構造を持つロボットの行動学習として、同型性に基づく抽象化強化学習法を考案し、以下の研究を行った。
(1)状態空間の階層的な同型性の解析による、階層化抽象空間の生成
同型性に基づく抽象化だけでは不十分な場合、抽象空間の階層的な同型性を利用すると、階層的な抽象空間を段階的に生成して、より小さな抽象空間を求め、解析の計算コストを削減することができることを示した。
(2)効率的な抽象化プランニングと詳細化
生成した階層的な抽象空間中に、初期状態と目標状態とを写像し、抽象空間における、初期状態と目標状態とを結ぶ状態遷移をプランニングにより求めて、抽象プランを効率よく探索できることを示した。
(3)ロボットの行動学習システムの構築
現有の計算機と通信しながら学習するロボットの行動学習システムを構築した。シミュレーション学習と実環境での実ロボットとのハイブリッド強化学習システムを作成し、両者の学習システムを共通化することにより、仮想個体、実ロボット間での学習結果の交換を可能とした。学習法として、経験強化型のClassifier Systemを元にして、高速化の拡張を行い、従来困難だった実ロボットでの実時間強化学習を実現した。
(4)同型性に基づく強化学習法による、ロボットの多様な行動の獲得
構築したロボットの行動学習システムを用いて、まずあるタスクで強化学習を行い、得た学習結果に対し、行為の同型性を利用した置換を組み合わせ的に施して同型な学習結果を生成し、学習結果のバリエーションの探索を行う。その結果、学習したタスクを達成する、同型な挙動や、学習タスクに似た、類似挙動など、従来の強化学習法では、得られない多様な行動を、効率的に獲得することができた。

報告書

(1件)
  • 1995 実績報告書
  • 研究成果

    (5件)

すべて その他

すべて 文献書誌 (5件)

  • [文献書誌] Tomohiro Yamaguchi: "Learning Cooperative Behaviors with Spontaneous Mimetism" Proc.of 6th Int.Fuzzy Systems Association World Congress(IFSA-95). Vol.1. 101-104 (1995)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] 田中康祐: "実ロボットとシミュレータ・エージェントとの協調による行動学習システム" 第13回ロボット学会学術講演会. No.1. 457-458 (1995)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] 増渕元臣: "ロボットにおけるドリブル動作の実環境下での強化学習" 第13回ロボット学会学術講演会. No.1. 459-460 (1996)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] Tomohiro Yamaguchi: "Multi-agent Reinforcement Learning with Adaptive Mimetism" Proc.of 5th Int.Workshop on Artificial Life(ALife V)1996 at Nara,ATR,(poster accepted). (1996)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] Tomohiro Yamaguchi: "Propagating Leamed Behaviors from a Virtual Agent to a Physical Robot in Reinforcement Learning" Proc.of IEEE Int.Conf.on Evolutionary Computation(ICEC-96)at Nagoya,(accepted). (1996)

    • 関連する報告書
      1995 実績報告書

URL: 

公開日: 1995-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi