人間は本を読んだり、言語を使って論理的に思考するといった「記号に基づく情報処理」と景色を見たり、音声や画像を認識するといった「パターンに基づく情報処理」を統合して高次認知機能を実現している。本研究では、それらのモデルを提案し、マルチエージェント環境にも適用できるようにすることが目的である。 今年度は、その第一歩としてエージェント単体による記号処理とパターン処理の統合モデルを提案した。具体的には記号処理部分として、if thenルールからなるデータベース部と、複数の強化学習器からなる学習部で構成される。データベース部はあらかじめ設計者がデータを与える。学習部はデータベース部の情報と環境情報を使用することによりエージェントが自律的に学習を行う。 実験としては、マルチエージェント問題の標準プラットフォームであるRoboCup Soccer Serverを用いて、本モデルにより行動するエージェントと強化学習だけのエージェントの学習能力を比較したところ、強化学習だけでは学習が困難な問題も学習可能であった。これは、強化学習だけでは探索空間が膨大であるので、データベース部を使うことによりその探索空間を減少させることにより学習が可能になったと考えられる。来年度はマルチエージェントに拡張することと現在作成中のロボットを完成させ実ロボットで当該モデルの有効性を検証する予定である。
|