研究課題/領域番号 |
19K12176
|
研究機関 | 熊本高等専門学校 |
研究代表者 |
本木 実 熊本高等専門学校, 電子情報システム工学系TE-Gr, 教授 (40320139)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | スパイキングニューラルネット / 強化学習 / オンチップ自律学習 |
研究実績の概要 |
まず,研究の目的である,価値形成目的型のSAM-SNNの強化学習の研究,および本機能を有する脳型情報処理回路の開発のうち,前者のSAM-SNNの強化学習の研究について,「目標到達タスク」において初めてSAM-SNNを利用したモデルにて学習の成功を確認した.これ以前は,当初目標到達はするものの,エリア内のcriticの値を分析してもエリア内で妥当な分布となっていなかったため,学習できているとは言えない状況であった.分析とパラメタ調整とを粘り強く繰り返すことにより,(従来のMLPではなく)本SAM-SNNでも妥当なcritic分布を得ることができた.すなわちSAM-SNNによる強化学習の成功を確認した.この成功により,FPGAなどのディジタル回路に乗算器不要で小規模で実装が可能なオンデバイス学習(教師あり学習)可能なSAM-SNNで,教師ベクトルが不要となる「オンチップ自律学習」の光が見えてきた.知財化を検討することも可能となった.しかしながら,そのcritic分布は滑らかさに欠け,さらにエリアの規模が小さいため,今後,エリアを拡大させながら分析を継続する必要がある. 次に後者の,脳型情報処理回路の開発は,進展している状況である.具体的には,昨年度,本SAM-SNNの回路をFPGA(Xilinx Zynq Processor)へ実装した後,今年度は,筋電信号センサ入力とロボットハンドを出力とする筋電-ロボットハンドアプリにおいて,筋電センサに能動電極を用いたものを利用して,より安定したシステムの開発を進めることができた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
当初,2年を目途に,価値形成目的型のSAM-SNNの強化学習(主に中間層actorネットを想定したもの)について,一定の成果を期待していた.実績の概要に記述した通り,目標到達タスクにおいて,本SAM-SNNでも妥当なcritic分布を得ることができた(すなわちSAM-SNNによる強化学習の成功を確認した)という初めの大きな一歩の実績を得ることができた.しかし,このタスクにおける学習の安定性や条件の明確化,さらに,これを他のタスクまで拡張させ,より一般化したものにできる見通しはまだ立っていない.そして,脳型情報処理回路の開発とフェーズをあわせて,オンチップ自律学習を有するSAM-SNNのFPGA実装とするまではまだ至っていない.
|
今後の研究の推進方策 |
まず,目標到達タスクにおける,計算機シミュレーションを継続して推進し,パラメタ調整を行いながら学習させて各種条件の明確化を行う.さらに,これを他のタスク,AI GYMでのCartpole Problemでの実施を試みる.Cartpole Problemは,オンチップ自律学習を有する脳型情報処理回路が得意な高速性を必要とするポピュラーな制御問題であり,このタスクでの機能,性能確認を行うことにより,オンチップ自律学習を有する脳型情報処理回路の産業応用のための重要なベンチマークデータを得ることができると考えている. 開発の方も並行して進め,オンチップ自律学習機能を有するSAM-SNNのFPGA実装となるように実施を進める.
|
次年度使用額が生じた理由 |
当初,欧州への国際会議への参加を予定していたが,新型コロナウィルスの影響により国外への出張が叶わなくなったため.
|