平成8年度は、適応型問題解決アルゴリズムをマルチエージェントの協調問題解決に適用する。具体的には実時間探索と強化学習を出発点として以下の機能を実現した。 1.実時間探索を用いた両方向探索: まず、2つの問題解決器による実時間両方向探索アルゴリズムを考案した。実時間両方向探索では、2つの問題解決器が互いに互いを目標として移動する。この問題を通じて協調問題解決における基本的な性能的諸課題を議論を明らかにした。 2.強化学習を用いたプロトコルの獲得: 強化学習では、これまでマルコフ決定問題を対象にQ-learningなどの確率収束に基づくアルゴリズムが提案されてきた。分散プログラムのあるクラスは(例えば「哲学者の食事問題」のように)有限オートマトンで表現できるものがあり、環境の不確実性を考慮するとマルコフ決定問題で近似できる。そこで強化学習をプロトコルの学習に適用を試み、様々な実験を行った。
|