令和3年度においては、令和元年度に行った分類問題への応用、令和2年度に行った強化学習への応用を踏まえて、マルチエージェントの強化学習問題への応用を図り、環境変化への耐性を示した。 本研究では、ニューラルネットワークに大規模なデータを学習させる際に生じる「破滅的な忘却」を回避して、継続的な学習を可能にするニューラルネットワークを設計することを目的とする。「破滅的な忘却」は、新しい知識を学習させていくと、過去に獲得した知識を極度に失う問題である。手段として、人間の脳において学習の干渉の軽減に貢献しているとされるモジュール性の発生メカニズムを人工ニューラルネットワークの設計に取り入れる。将来的には継続的な学習への応用が期待される。 (1)令和3年度ではマルチエージェントの強化学習問題への応用を図った。マルチエージェントの場合でも、各エージェントは破滅的な忘却なしに複数の環境を学習可能であることをいくつかの代表的な例で示した。 (2)加えて、令和2年度に行った強化学習の問題への応用に関する研究をまとめ、国際会議に投稿した。目先の環境のみに対して学習させたニューラルネットワークと比較して、目先の環境に加えて時間的もしくは空間的に異なる環境を交互に与えながら学習させたニューラルネットワークの方が、未学習の環境に遭遇した際の学習精度の低下を抑えることができることをいくつかの代表的な環境に対して明らかにした。
|