研究課題/領域番号 |
20H04258
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分61040:ソフトコンピューティング関連
|
研究機関 | 公立はこだて未来大学 |
研究代表者 |
香取 勇一 公立はこだて未来大学, システム情報科学部, 教授 (20557607)
|
研究分担者 |
田向 権 九州工業大学, 大学院生命体工学研究科, 教授 (90432955)
森江 隆 九州工業大学, 大学院生命体工学研究科, 特任教授 (20294530)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
17,550千円 (直接経費: 13,500千円、間接経費: 4,050千円)
2023年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2021年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2020年度: 4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
|
キーワード | レザバー計算 / ニューラルネットワーク / 感覚情報処理 / 運動制御 / 人工知能 / 機械学習 / 脳型人工知能 / 脳型情報処理 |
研究開始時の研究の概要 |
超立方体上の疑似ビリヤード・ダイナミクスを用いた計算機構(「超立方体計算」と呼ぶ)は、人工知能、機械学習、ニューラルネットワークなど多様な情報処理の基盤になる枠組みで、これまでにない超高速・超省電力のハードウェアを実現するアーキテクチャである。本研究申請では、①情報処理に有効なネットワーク構造・学習機構の構築により、超立方体計算の理論を確立する。②超立方体計算を集積回路に実装し、その効率的な回路構成法を確立する。③超立方体計算を基に、センサー情報処理、アクチュエータ制御、行動計画のシステムを構築し、その実用性を明らかにする。本研究により、新しい情報処理プラットフォームの構築に道筋をつける。
|
研究実績の概要 |
最終年度の2023年度は、超立方体上の疑似ビリヤード・ダイナミクスを用いた計算機構(超立方体計算)について、前年度までの応用探索の成果であるレザバー強化学習モデルを電子回路に実装し、その有効性を確認した。さらに応用先のさらなる探索を進め、複合的なレザバー計算モデルを構築した。 電子回路実装については、FPGA上にレザバー強化学習モデルを実装し、その有効性を示した。低消費電力かつ高集積のVLSIハードウェアを実現し、二次元空間で構成された環境での行動計画タスクに適用し、その有効性を確認した。複合的なレザバー計算モデルの構築では、まず視覚情報のみを使用してエージェントの行動を計画するためのレザバー・ベースのメンタルシミュレーションモデルを提案した。このモデルは予測符号化とレザバー計算モデルを組み合わせることで、エージェントの行動を最適化し、目標状態に到達するための環境をシミュレートする。また、多層構造を取り入れたレザバー・ソフトアクタークリティックモデルの研究では、部分観測可能なマルコフ決定過程(POMDP)におけるオフポリシー強化学習モデルとレザバー計算を組み合わせた新しいアプローチを提案した。レザバー計算の出力層に多層構造を導入することで性能が向上し、POMDPにおける学習を効果的に促進することが明らかになった。さらに、モータープリミティブの生成と切り替えのためのレザバー強化学習モデルの研究では、基本的な運動パターンであるモータープリミティブを生成し、これらを切り替えるための強化学習モデルを提案した。連続した状態行動空間を持つタスクにおいて、提案モデルがモータープリミティブの切り替えを行い、複雑な軌道パターンを生成する能力を示した。これらの結果から、提案モデルが実世界環境での効率的な学習、行動計画、教示データの欠如や未知の環境への適応という課題に対処できる可能性が示された。
|
現在までの達成度 (段落) |
令和5年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和5年度が最終年度であるため、記入しない。
|