研究課題
最終年度の2023年度は、超立方体上の疑似ビリヤード・ダイナミクスを用いた計算機構(超立方体計算)について、前年度までの応用探索の成果であるレザバー強化学習モデルを電子回路に実装し、その有効性を確認した。さらに応用先のさらなる探索を進め、複合的なレザバー計算モデルを構築した。電子回路実装については、FPGA上にレザバー強化学習モデルを実装し、その有効性を示した。低消費電力かつ高集積のVLSIハードウェアを実現し、二次元空間で構成された環境での行動計画タスクに適用し、その有効性を確認した。複合的なレザバー計算モデルの構築では、まず視覚情報のみを使用してエージェントの行動を計画するためのレザバー・ベースのメンタルシミュレーションモデルを提案した。このモデルは予測符号化とレザバー計算モデルを組み合わせることで、エージェントの行動を最適化し、目標状態に到達するための環境をシミュレートする。また、多層構造を取り入れたレザバー・ソフトアクタークリティックモデルの研究では、部分観測可能なマルコフ決定過程(POMDP)におけるオフポリシー強化学習モデルとレザバー計算を組み合わせた新しいアプローチを提案した。レザバー計算の出力層に多層構造を導入することで性能が向上し、POMDPにおける学習を効果的に促進することが明らかになった。さらに、モータープリミティブの生成と切り替えのためのレザバー強化学習モデルの研究では、基本的な運動パターンであるモータープリミティブを生成し、これらを切り替えるための強化学習モデルを提案した。連続した状態行動空間を持つタスクにおいて、提案モデルがモータープリミティブの切り替えを行い、複雑な軌道パターンを生成する能力を示した。これらの結果から、提案モデルが実世界環境での効率的な学習、行動計画、教示データの欠如や未知の環境への適応という課題に対処できる可能性が示された。
令和5年度が最終年度であるため、記入しない。
すべて 2024 2023
すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (9件) (うち国際学会 8件) 産業財産権 (1件)
Nonlinear Theory and Its Applications, IEICE,
巻: 15, (2), ページ: 421~431
10.1587/nolta.15.421
巻: 15, (2), ページ: 432~442
10.1587/nolta.15.432
The Proceedings of the National Academy of Sciences (PNAS)
巻: 120 ページ: e2217008120
10.1073/pnas.2217008120