1997 Fiscal Year Annual Research Report
カオス力学系と学習の融合による動的世界に対する適応機構の構築に関する研究
Project/Area Number |
09878063
|
Research Institution | Hokkaido University |
Principal Investigator |
三上 貞芳 北海道大学, 大学院・工学研究科, 助教授 (50229655)
|
Co-Investigator(Kenkyū-buntansha) |
山口 明宏 北海道大学, 大学院・工学研究科, 助手 (60281789)
和田 充雄 北海道大学, 大学院・工学研究科, 教授
|
Keywords | カオス / マルチエージェント / 強化学習 / 時系列予測 / 指尖脈波 / 協調行動 / 動的環境 |
Research Abstract |
本研究は,動的,複雑に変化する実世界を対象とした,実時間のプランニング・学習問題を取り扱うための,理論および実装手法を,カオス力学系の理論と強化学習の理論の融合によるアプローチにより研究するもので,当該期間に得られた成果は以下のようにまとめられる. 1.実環境のセンシングデータを力学系により同定する手法の研究として,ダイナミクスの識別問題に焦点を当てて,カオティックな実環境データを高精度に区別する理論と手法を開発した.具体的には,ある環境,すなわちある特定の動的システムから生成された入力時系列を局所再構成して蓄積しておき,識別したい入力時系列によって再構成により蓄積したシステムを駆動して,その誤り率から区別を行うもので,テストデータとして指尖脈波信号による個体識別へ応用して有効性を確認している.これによりカオティックな実世界データをダイナミクスの立場で識別する基礎を得た. 2.上述の力学系の同定を学習に組み入れる手法の研究を進めた.具体的には,局所再構成による短期予測に焦点を当てて,強化学習の政策の表現に,予測出力を導入することでコンテクスト依存性を解消し,かつ学習を正しい経験に基づいて行うような学習理論を得た. 3.さらにダイナミクスによる環境同定とその学習を同時に行うシステムが相互に共通環境で作業する場合に,ダイナミクスの形成とそれによる協調行動の自動発生が期待でき,集団での動的環境への適応が起きることを,実験を通じて十分な可能性を確認した.
|
-
[Publications] Sadayoshi Mikami: "Prediction Based Reinforcement Learning for Dynamic Environment" Intelligent Engineering Systems Through Artificial Neural Networks. 7. 139-144 (1997)
-
[Publications] Sadayoshi Mikami: "Adaptive Gait Generation as an Analogy to Magnetising Process" Proc.Intl.Symp.on Artificial Life and Robotics 98.235-237 (1997)
-
[Publications] 三上貞芳: "強化学習のマルチエージェント系への応用" 人工知能学会誌. 12,6. 34-37 (1997)
-
[Publications] 三上貞芳: "行動学習とカオス" 日本ロボット学会誌. 15,7. 32-35 (1997)
-
[Publications] Akihiro Yamaguchi: "Extraction of Dynamic Structure of Biological Signals as Stochastic Automata for a Human-Machine Interface" 1997 IEEE International Conference on Robots and Human. 271-275 (1997)