• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

強化学習による移動ロボットのための状態空間の自動構成法に関する研究

研究課題

研究課題/領域番号 07243214
研究種目

重点領域研究

配分区分補助金
研究機関大阪大学

研究代表者

浅田 稔  大阪大学, 工学部, 教授 (60151031)

研究分担者 鈴木 昭二  大阪大学, 工学部, 助手 (50273587)
細田 耕  大阪大学, 工学部, 助手 (10252610)
研究期間 (年度) 1995
研究課題ステータス 完了 (1995年度)
配分額 *注記
2,200千円 (直接経費: 2,200千円)
1995年度: 2,200千円 (直接経費: 2,200千円)
キーワード強化学習 / 状態空間 / 自律的分割 / サッカーロボット
研究概要

強化学習を適用するには、状態空間を適切に選択する必要がある.本研究では,選択されたセンサー情報を自律的に分割する問題を,サッカーロボットがシューティング行動を強化学習するタンクを例にとり,経験による視覚情報の文節化を実施した.本年度の研究実績及び評価は以下の通りである.
視覚情報から得られる情報として,ロボットに塔載されたTVカメラから得られるボール及びゴールの画像が得られ,二つの独立なモーターで起動される移動車を想定した.
1.状態空間を構成する要素として,ボールの位置,大きさ,ゴールの位置,大きさ,向きを選択した.情報選択に関しては、統計的手法を用いて自動化を試みており,対象物体が背景から容易に抽出できる場合は,選択可能性が高いことを確認している.
移動車は,左右独立のモータにそれぞれ,前進,停止,後退の3種の動きが実現でき,合計9つの移動がとれる行動空間を想定した.ボールをゴールにシュートできる行動と状態のペアを経験から求め,状態空間のサンプリング点として記録し,統計的手法を用いて,成功を多く含み失敗をなるべくふくまない凸の状態集合を求め,一つの状態として記録した.
上で獲得された状態をゴール状態として,同様の操作を繰り返し、経験に基づく状態空間のクラスタリングを実現した.
クラスタリングされた状態空間を用いて強化学習を実施し,状態数の軽減,それゆえ学習時間が激減できることをシミュレーションで示した.
実機でデータをサンプルし学習を実施した結果,シュート行動が実現され,手法の有効性が確認できた.但し,データサンプルに偏りがあると,失敗することもあり,いかに良好なデータを与えるかが,今後の課題となった.

報告書

(1件)
  • 1995 実績報告書

研究成果

(4件)

すべて その他

すべて 文献書誌

  • [文献書誌]

    • 関連する報告書
      1995 実績報告書
  • [文献書誌]

    • 関連する報告書
      1995 実績報告書
  • [文献書誌]

    • 関連する報告書
      1995 実績報告書
  • [文献書誌]

    • 関連する報告書
      1995 実績報告書

URL: 

公開日: 1995-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi