2001 Fiscal Year Annual Research Report
Project/Area Number |
13450176
|
Research Institution | Yamaguchi University |
Principal Investigator |
大林 正直 山口大学, 工学部, 教授 (60213849)
|
Co-Investigator(Kenkyū-buntansha) |
小林 邦和 山口大学, 工学部, 助手 (40263793)
|
Keywords | ニューラルネットワーク / 強化学習 / 連想記憶 / ロボット制御 / カオスの辺縁 / 関数型記憶行列 / 情報生成 / 自己組織化 |
Research Abstract |
自律システムを取り巻く環境が静的な場合において、内部モデル連想記憶型自律システムを構成するために必要な、1)環境との相互作用にて行う行動学習法である強化学習法、2)連想記億の想起能力の向上に関する研究を主として行った。 1.適応的強化学習法の提案 ・強化学習における試行錯誤において、試行に関する探索方向を適応的に変化させることを提案しその枠組みを検討した.本方式をactor-critic及び確率傾斜法へ適用し,倒立振子の制御及び自律走行ロボットの行動学習を例題と,して高い探索効率及び学習試行回数の減少効果な持つことをシミュレーションにより確認した。本研究費で購入した自律移動ロボットによる検証は次年度の課題とした。 2.連想記憶方式とそのモデル化に関する検討 ・本年度は、複数の行動パターンが互いに相関を持つ場合を想定し、行動パターンが互いに高い相関を持つ場合も、記憶している行動を容易に想起可能とする関数型記憶行列を有する記憶想起方式について検討し,従来方式に比較し、想起能力が高いことをシミュレーションにより確認した。現在、論文誌投稿の準備中である。 3.カオスの辺縁を利用したシステムの情報生成に関する基礎的検討 ・ロボットが確率的でなく、創造的な行動をとることが可能とする、すなわち、ロボットの記憶にない行動を創造する,情報生成のための基礎的検討を行った。
|
Research Products
(2 results)
-
[Publications] 梅迫 公輔: "適応的探索法を用いた強化学習"電気学会論文誌. 122-C・3. 374-380 (2002)
-
[Publications] Masanao Obayashi: "Self-Organized Reinforcement Learning Using Fuzzy Inference for Stochastic Gradient Ascent Method"Proceedings of International Conference on Control, Automation and Systems. 735-738 (2001)