研究概要 |
本研究はエージェントが学習の中で自らの概念空間を分節化し,学習の効率化に役立て,その適応的なプロセスを視覚化することによって共感的な人間-エージェント間の関係や新しい(マルチ)エージェントモデルを構築するものである.本研究はそのような共感的なコミュニケーションを支援するエージェントを設計し,実装することを目標とする.本研究のエージェントの持つ一番大きな特性は,エージェントが自らの学習のための探索空間を自らの試行錯誤の過程の中で徐々に分節化していく点(分割,統合,軸のぶれ等を繰り返す)にある. 今年度は新しく学習を極限まで簡素化することによって,強化学習における認知的な負担を軽減するアルゴリズムを開発した.鎖型強化学習と名付けたこの手法は目標状態につながる状態と行動の組をつなげていくように保存する学習アルゴリズムで,Q学習と比較して大幅にメモリ使用量を減らすことに成功した.また,当初検討予定だった転移学習では,エージェント間のコミュニケーションをその伝達される情報の情報量を必要最低限の状態にまで削減することの学習に対する影響を調査し,発表した.特に,主成分分析によって得られた大まかな情報を利用し,単純な2次元グリッド上の迷路問題で,設定次第では学習時間を半分程度に減らすことが可能となった.双方とも国際会議で発表し,国際学術誌,国内学術誌での査読が終わり,掲載が決まっている.さらに,社会シミュレータとして学習エージェントによるCO2排出量を検討するための都市シミュレータを開発した.これは国内会議,国際会議での発表が決定している.
|