研究概要 |
本年度は,生産システム内の自律機械群において大域的に整合性の取れた挙動を生成するための機構について,言語を用いない方式と用いる方式との二つのアプローチから研究を進めた. 言語系を用いない方式:自律機械群の調和挙動を生成するために,各自律機械に強化学習機構を持たせるアプローチをとった.しかし,自身の報酬を最大化しようとする強化学習を単純に適用するのみだと,利己的な行動ばかりを生成して群が混乱に陥ったままで大域的秩序の形成はできない.そのため,利己的行動のみではなく,状況に応じて利他的な行動が生成される意思決定の仕組みが必要である.本アプローチでは意思決定を,(1)利己的/利他的の選択,および(2)行動選択,の二段の強化学習からなる意思決定機構を構築し,その効果を計算機実験により確認した.自律機械群は状況に応じた適応的行動戦略を生成して,大域的制御機構無しにシステム全体として秩序だった調和した振る舞いが発現されることを確認できた. 言語系を生成する方法:何が言語になり得るかという基礎的な問題から本研究をスタートさせるために,行動生成に冗長な情報である"音"を発する機能を各自律機械に与え,これを通信手段とする2台の自律機械同士の調和行動生成を連続時間型人工神経回路網進化を用いて計算機実験を行った.この問題を進化型計算パラダイムから見ると実関数最適化問題となるため,その第1ステップとして高速かつ頑健な進化アルゴリズムを構築した.次に,これを用いて調和挙動生成の計算機実験を行い,音の情報を適応的に使いながら行動生成するように進化することを確認することができた.
|