研究概要 |
本研究は,動的,複雑に変化する実世界を対象とした,実時間のプランニング・学習問題を取り扱うための,理論および実装手法を,カオス力学系の理論と強化学習の理論の融合によるアプローチにより研究するもので,当該期間に得られた成果は以下のようにまとめられる. 1.実環境のセンシングデータを力学系により同定する手法の研究として,ダイナミクスの識別問題に焦点を当てて,カオティックな実環境データを高精度に区別する理論と手法を開発した.具体的には,ある環境,すなわちある特定の動的システムから生成された入力時系列を局所再構成して蓄積しておき,識別したい入力時系列によって再構成により蓄積したシステムを駆動して,その誤り率から区別を行うもので,テストデータとして指尖脈波信号による個体識別へ応用して有効性を確認している.これによりカオティックな実世界データをダイナミクスの立場で識別する基礎を得た. 2.上述の力学系の同定を学習に組み入れる手法の研究を進めた.具体的には,局所再構成による短期予測に焦点を当てて,強化学習の政策の表現に,予測出力を導入することでコンテクスト依存性を解消し,かつ学習を正しい経験に基づいて行うような学習理論を得た. 3.さらにダイナミクスによる環境同定とその学習を同時に行うシステムが相互に共通環境で作業する場合に,ダイナミクスの形成とそれによる協調行動の自動発生が期待でき,集団での動的環境への適応が起きることを,実験を通じて十分な可能性を確認した.
|