2007 年度実績報告書

ニューラルネットを用いた強化学習で,どこまで高次機能の創発が説明できるかへの挑戦

研究課題

研究課題/領域番号	19300070
研究機関	大分大学
研究代表者	柴田克成大分大学, 工学部, 准教授 (10260522)
キーワード	強化学習 / リカレントニューラルネット / 高次機能創発 / 離散状態遷移 / 乗算ニューロン / 決定論的知的探索 / 空間的抽象化 / 時間的抽象化
研究概要	本年度はまず,リカレントニューラルネットへの乗算ニューロンの導入により,従来困難だった離散状態間遷移の学習を目指した。その際,出力ニューロンをフィードバックする構造の導入によって,離散状態遷移の学習が大きく改善されそうであることを発見した。そして,簡単な数を数えるという問題において,出力ニューロンのフィードバックの導入で学習性能が大幅に向上することを示した。さらに,強化学習を行なう際に,従来のような階層型ではなく,リカレント型のニューラルネットを導入することにより,シミュレーションでの移動ロボットのゴール到達タスクにおいて,ゴール到達前にスイッチを踏んで,そのスイッチの種類によって2つのゴールのうちのどちらかに向かうことを求めると,スイッチを踏んでから正しいゴールに向かう行動が学習できることがわかった。また,その際に,隠れ層の中に,踏んだスイッチの種類を記憶しているニューロンが発見され,さらに,ゴールに到達しても報酬を与えないで試行を続けると,スイッチを踏みに戻るという非常に興味深い行動が観察された。また,強化学習においてニューラルネットを使うことの有用性を現実レベルの問題で確かめるために,視覚センサを搭載した四足歩行ロボットを用いて,相手のロボットに近づいて行ってキスをするというタスクの学習をさせた。そして,タスクの情報も,画像認識の方法も一切与えることなく,照明条件や背景,ロボットの向きなどによらず,実世界に近い環境において,80から90%程度の割合でタスクを成功させることができた。強化学習による決定論的知的探索の学習の研究においては,エージェントが過去の記憶を利用した探索を学習できることを示し,かつ,探索を通して環境の情報をある程度把握できることを示した。しかしながら,以前記憶したことを忘れてしまう傾向にあることがわかった。これを解決して行くことは今後の課題である。

研究成果
(5件)

すべて 2007 その他

すべて雑誌論文 (4件) (うち査読あり 1件) 備考 (1件)

[雑誌論文] Practical Recurrent Learning (PRL) in the Discrete Time Domain2007
- 著者名/発表者名
  Mohamad Faizal Bin Samsudin, Takeshi. Hirose, Katsunari. Shibata
- 雑誌名
  
  Proc. of Int'l Conf. on Neural Information Processing System (CD-ROM)
- 査読あり
[雑誌論文] 画像入カニューラルネットを用いた強化学習による可動カメラの対象物検出行動2007
- 著者名/発表者名
  河野友彦, 幸和芳, 柴田克成
- 雑誌名
  
  第26回計測自動制御学会九州支部学術講演会予稿集
  
  ページ: 155-158
[雑誌論文] リカレント型ニューラルネットの実用的な学習則である離散時間PRL学習法2007
- 著者名/発表者名
  Mohamad Faizal Bin Samsudin, 廣瀬武志, 柴田克成
- 雑誌名
  
  第26回計測自動制御学会九州支部学術講演会予稿集
  
  ページ: 57-60
[雑誌論文] 複数の隠れニューロンの生成が可能な成長型ニューラルネットの構築2007
- 著者名/発表者名
  由崎高志, 柴田克成
- 雑誌名
  
  第26回計測自動制御学会九州支部学術講演会予稿集
  
  ページ: 53-56
[備考]
- URL
  http://shws.cc.oita-u.ac.jp/~shibata/home-j.html

2007 年度 実績報告書

ニューラルネットを用いた強化学習で,どこまで高次機能の創発が説明できるかへの挑戦

研究代表者

柴田 克成 大分大学, 工学部, 准教授 (10260522)

研究成果

[雑誌論文] Practical Recurrent Learning (PRL) in the Discrete Time Domain2007

著者名/発表者名

雑誌名

[雑誌論文] 画像入カニューラルネットを用いた強化学習による可動カメラの対象物検出行動2007

著者名/発表者名

雑誌名

[雑誌論文] リカレント型ニューラルネットの実用的な学習則である離散時間PRL学習法2007

著者名/発表者名

雑誌名

[雑誌論文] 複数の隠れニューロンの生成が可能な成長型ニューラルネットの構築2007

著者名/発表者名

雑誌名

[備考]

URL

2007 年度実績報告書

柴田克成大分大学, 工学部, 准教授 (10260522)