• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 研究成果報告書

時間軸を考慮したニューロベース強化学習によるシンボル処理創発への突破口の模索

研究課題

  • PDF
研究課題/領域番号 23500245
研究種目

基盤研究(C)

配分区分基金
応募区分一般
研究分野 知覚情報処理・知能ロボティクス
研究機関大分大学

研究代表者

柴田 克成  大分大学, 工学部, 准教授 (10260522)

研究期間 (年度) 2011 – 2013
キーワード知能ロボット / 強化学習 / ニューラルネット / 高次機能 / シンボル処理創発 / 因果トレース / 概念形成 / コミュニケーション学習
研究概要

膨大な時空間情報の中での効率的な学習は,実世界での高次機能創発の鍵を握る。本研究では,特に時間軸の扱いに注目した。事象の重要度を「主観的」に判断し,過去の事象に対する学習に利用する「因果トレース」の考え方を提唱し,状態価値の学習で飛躍的に学習性能が向上した。また,「概念」は行うべき行動の差に基づいて形成されるとの考えの下,強化学習によってリカレントネット内で離散的・抽象的な状態表現が形成された。さらに,自律的なコミュニケーション学習によって物体の動きの情報を伝達できることを示した。時間軸の処理に対して新たな展望をもたらしたが,シンボル処理創発にはダイナミクスの学習能力の更なる向上が必要である。

  • 研究成果

    (12件)

すべて 2014 2013 2012 2011

すべて 雑誌論文 (6件) 学会発表 (6件) (うち招待講演 1件)

  • [雑誌論文] Emergence of Flexible Prediction-Based Discrete Decision Making and Continuous Motion Generation through Actor-Q-Learning2013

    • 著者名/発表者名
      Katsunari Shibata and Kenta Goto
    • 雑誌名

      Proc. of Int'l Conf. on Development and Learning and on Epigenetic Robotics (ICDL-Epirob)

      巻: ID 15 (CDROM)

  • [雑誌論文] Mohamad Faizal bin Samsudin and Katsunari Shibata, Emergence of Discrete and Abstract State Representation in Continuous Input Task through Reinforcement Learning, Advances in Intelligent Systems and Computing, Robot Intelligence Technology and Applications 20122012

    • 著者名/発表者名
      Yoshito Sawatsubashi, Mohamad Faizal bin Samsudin and Katsunari Shibata
    • 雑誌名

      Proc. of RiTA

      巻: 13-22

  • [雑誌論文] Differential Trace in Learning of Value Function with a Neural Network, Advances in Intelligent Systems and Computing, Robot Intelligence Technology and Applications 20122012

    • 著者名/発表者名
      Katsunari Shibata and Shuji Enoki
    • 雑誌名

      Proc. of RiTA

      巻: 55-64

  • [雑誌論文] Emergence of Multi-Step Discrete State Transition through Reinforcement Learning with a Recurrent Neural Network2012

    • 著者名/発表者名
      Mohamad Faizal bin Samsudin, Yoshito Sawatsubashi and Katsunari Shibata
    • 雑誌名

      LNCS(Lecture Notes in Computer Science), Neural Information Processing, Proc. of ICONIP (Int'l Conf. on Neural Information Processing)

      巻: 7664 ページ: 583-590

  • [雑誌論文] Emergence of Color Constancy Illusion through Reinforcement Learning with a Neural Network2012

    • 著者名/発表者名
      Katsunari Shibata and Shunsuke Kurizaki
    • 雑誌名

      Proc. of ICDL-EpiRob (Int'l Conf. on Development and Learning- Epigenetic Robotics)

    • DOI

      10.1109/DevLrn.2012.6400580

  • [雑誌論文] Emergence of Purposive and Grounded Communication through Reinforcement Learning, LNCS(Lecture Notes in Computer Science)2011

    • 著者名/発表者名
      Katsunari Shibata and Kazuki Sasahara
    • 雑誌名

      LNCS(Lecture Notes in Computer Science), Vol. 7064, Proc. of ICONIP (Int'l Conf. on Neural Information Processing)

      巻: 7064 ページ: 66-75

  • [学会発表] 因果トレース - 並列かつ主観的時間スケールの導入による過去の処理の効率的学習2014

    • 著者名/発表者名
      柴田克成
    • 学会等名
      電子情報通信学会ニューロコンピューティング研究会
    • 発表場所
      東京
    • 年月日
      2014-03-18
  • [学会発表] 強化学習によるリカレントニューラルネットワーク内部での振動子創発の可能性2013

    • 著者名/発表者名
      品矢 裕介
    • 学会等名
      第32回計測自動制御学会九州支部学術講演会
    • 発表場所
      長崎
    • 年月日
      2013-12-01
  • [学会発表] RNN を用いた強化学習によるセンサ信号の時間変化を表すコミュニケーションの創発2013

    • 著者名/発表者名
      朱 祺
    • 学会等名
      第32回計測自動制御学会九州支部学術講演会
    • 発表場所
      長崎
    • 年月日
      2013-12-01
  • [学会発表] ニューラルネットを用いた価値関数の学習における 微分型トレースの提案2012

    • 著者名/発表者名
      榎修志
    • 学会等名
      計測自動制御学会システム, 情報部門学術講演会
    • 発表場所
      名古屋
    • 年月日
      2012-11-23
  • [学会発表] リカレントネットを用いた強化学習における 離散的かつ抽象的な状態表現の創発2012

    • 著者名/発表者名
      沢津橋由人
    • 学会等名
      計測自動制御学会 システム, 情報部門学術講演会
    • 発表場所
      名古屋
    • 年月日
      2012-11-23
  • [学会発表] あめとむちで知能を作る? -知能ロボットって本当に賢いの?2011

    • 著者名/発表者名
      柴田克成
    • 学会等名
      SOFT九州支部夏季ワークショップ
    • 発表場所
      玉名(熊本県)
    • 年月日
      2011-09-01
    • 招待講演

URL: 

公開日: 2015-07-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi