• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実績報告書

時間軸を考慮したニューロベース強化学習によるシンボル処理創発への突破口の模索

研究課題

研究課題/領域番号 23500245
研究機関大分大学

研究代表者

柴田 克成  大分大学, 工学部, 准教授 (10260522)

キーワード因果トレース / 強化学習 / リカレントニューラルネット / ロボット / コミュニケーション学習 / 動詞表現 / 離散的・抽象的表現 / 自律的役割分担
研究概要

学習のための過去の記憶における時間軸の調整を行う微分型トレース(因果トレースと名前を変更した)については,状態滞在時間に大きなアンバランスがある場合の状態価値の学習に対して,他の手法と比較して,圧倒的な優位性があることを示すことができた。また,その際,過去のイベントの中間層での表現において,中間層ニューロン間での役割分担が進むことを確認し,本手法が学習時の時間の扱いに対する画期的な方法であり,今後に向けて大きな発展性があることを示すことができた。
また,微分型トレースを動作の学習も含めた強化学習へ適用することに関しては,懸念されていた試行錯誤による微分型トレースの効果の大幅な減少は限定的であることを示唆する結果が得られた。
多数の部屋からなる環境での強化学習による離散的・抽象的表現の獲得については,ロボットシミュレータWebots上で部屋とロボットよりなる環境を構築し,ロボットが画像データを取り込んで学習できるようになった。しかし,まだ十分なデータを取るには至っていない。
一方,コミュニケーションにおける動詞表現の獲得については,送信者には物体が運動している状況を捉えた簡単な視覚センサ信号を入力し,送信する信号とセンサの動きを生成し,受信者側にはその信号を入力し,物体の動きを認識させる。両者が強化学習で学習した結果,送信者側は過去のセンサ信号を考慮した適切なコミュニケーション信号を送ることができ,受信者側もその信号を受けて,「そこまでのセンサ信号からだけでは認識できない」という状態も含めて,適切な認識結果を出力できることを示した。その際,送信者が予め動きの認識を学習すること,その際に問題を徐々に難しくしていくこと,さらには,認識学習からコミュニケーション学習に移行する際に,ニューラルネットの内部表現が大きく壊れないようにする工夫が必要であった。

  • 研究成果

    (10件)

すべて 2014 2013

すべて 雑誌論文 (5件) (うち査読あり 1件) 学会発表 (5件)

  • [雑誌論文] 因果トレース - 並列かつ主観的時間スケールの導入による過去の処理の効率的学習 -2014

    • 著者名/発表者名
      柴田 克成
    • 雑誌名

      電子情報通信学会技術報告

      巻: NC2013 ページ: 157-162

  • [雑誌論文] Emergence of Flexible Prediction-Based Discrete Decision Making and Continuous Motion Generation through Actor-Q-Learning2013

    • 著者名/発表者名
      Katsunari Shibata and Kenta Goto
    • 雑誌名

      Proc. of Int'l Conf. on Development and Learning and on Epigenetic Robotics (ICDL-Epirob) 2013

      ページ: ID 15

    • 査読あり
  • [雑誌論文] 強化学習によるリカレントニューラルネットワーク内部での振動子創発の可能性2013

    • 著者名/発表者名
      品矢 裕介, 柴田克成
    • 雑誌名

      第32回計測自動制御学会九州支部学術講演会予稿集

      ページ: 74-77

  • [雑誌論文] RNNを用いた強化学習によるセンサ信号の時間変化を表すコミュニケーションの創発2013

    • 著者名/発表者名
      朱 祺, 柴田克成
    • 雑誌名

      第32回計測自動制御学会九州支部学術講演会予稿集

      ページ: 71-74

  • [雑誌論文] 予測を要して連続動作を含む柔軟な行動のActor-Q学習による獲得2013

    • 著者名/発表者名
      柴田克成, 後藤健太
    • 雑誌名

      第23回インテリジェント・システム・シンポジウム (FAN 2013) 講演論文集

      ページ: 86-91

  • [学会発表] 因果トレース - 並列かつ主観的時間スケールの導入による過去の処理の効率的学習 -2014

    • 著者名/発表者名
      柴田克成
    • 学会等名
      電子情報通信学会ニューロコンピューティング研究会
    • 発表場所
      玉川大学,東京都
    • 年月日
      20140317-20140318
  • [学会発表] RNNを用いた強化学習によるセンサ信号の時間変化を表すコミュニケーションの創発2013

    • 著者名/発表者名
      朱 祺, 柴田克成
    • 学会等名
      第32回計測自動制御学会九州支部学術講演会
    • 発表場所
      長崎大学,長崎県
    • 年月日
      20131130-20131201
  • [学会発表] 強化学習によるリカレントニューラルネットワーク内部での振動子創発の可能性2013

    • 著者名/発表者名
      品矢 裕介, 柴田克成
    • 学会等名
      第32回計測自動制御学会九州支部学術講演会
    • 発表場所
      長崎大学,長崎県
    • 年月日
      20131103-20131201
  • [学会発表] 予測を要して連続動作を含む柔軟な行動のActor-Q学習による獲得2013

    • 著者名/発表者名
      柴田克成, 後藤健太
    • 学会等名
      第23回インテリジェント・システム・シンポジウム (FAN 2013)
    • 発表場所
      九州大学,福岡県
    • 年月日
      20131025-20131026
  • [学会発表] Emergence of Flexible Prediction-Based Discrete Decision Making and Continuous Motion Generation through Actor-Q-Learning2013

    • 著者名/発表者名
      Katsunari Shibata and Kenta Goto
    • 学会等名
      Int'l Conf. on Development and Learning and on Epigenetic Robotics (ICDL-Epirob) 2013
    • 発表場所
      Osaka, Japan
    • 年月日
      20130819-20130821

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi