研究課題/領域番号 |
15K00360
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
知能ロボティクス
|
研究機関 | 大分大学 |
研究代表者 |
柴田 克成 大分大学, 理工学部, 教授 (10260522)
|
研究期間 (年度) |
2015-04-01 – 2020-03-31
|
研究課題ステータス |
完了 (2019年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2019年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2018年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2017年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2016年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2015年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
|
キーワード | ダイナミック強化学習 / 感度 / 感度調整学習 / カオスニューラルネット / 思考 / 探索 / ダイナミクス / 汎用人工知能 / ニューラルネット / カオスダイナミクス / リアプノフ指数 / 勾配消失問題 / 深層学習 / 強化学習 / 決定論的探索 / 内部ダイナミクス / カオス生成・維持学習 / 因果トレース / 誤差逆伝播法 / 不応性 / 障害物回避 / 視覚センサ / カオスニューロン / リザバー / BPWT / 符号付き因果トレース / 高次探索 |
研究成果の概要 |
当初目標である,筆者が提案したカオスニューラルネット(NN)を用いた強化学習のアルゴリズムの確立,学習による「探索」から「思考」への成長仮説に基づいた「原始思考」の創発は達成できなかった。 その一方で,カオス性の制御のために各ニューロンに「感度」という指標を導入し,それを学習する「感度調整学習」を提案した。これがカオスの生成の指標となること,また,学習時の勾配消失・爆発問題の解決にも繋がることを示した。さらに,強化学習で用いるTD誤差(状態の評価の予測との差)によって「感度」を調整することで,現在の出力値ではなくダイナミクスを学習する全く新しい強化学習「ダイナミック強化学習」の考案に至った。
|
研究成果の学術的意義や社会的意義 |
各ニューロンのローカルな指標「感度」でニューラルネット全体のダイナミクスを制御すること,さらに,従来の静的な発想に基づく「現在の出力値を目的のものに近づける」ための学習という考えから脱し,動的な処理の学習に向けた「評価が良い場合は再現性を上げるためダイナミクスを収束へ,悪い場合は探索を強化するためダイナミクスを発散(カオス)へ」という「ダイナミック強化学習」は,全く新しい学習パラダイムを切り拓くものである。今後,より高次な機能が求められるに従い,求められるものが静的なものからより動的なものへとシフトしていく中で,学習の新たな根本原理としての役割を担うポテンシャルを持っていると期待している。
|