Research Abstract |
学習・適応戦略を持つ生産システムエージェントをマルチエージェントシステム問題として理論的に再構成をおこなった.この結果,Eを環境集合,Aをエージェント集合,Cを評価の集合とするとマルチエージェントの問題をMAP=(E, A, C)と表わし,C=C(E, A)を最適化する設計問題であることが導かれた.この定式化より設計変数はEとAとなるから,マルチエージェントの問題は,環境とエージェントを設計することが明かとなった.すなわち,これまでの概念では環境設計が考慮されていないことが明確化された.また,個々のエージェントA_jに対して,E_jをA_jの環境集合,c_jを評価の集合とすると,各エージェントはc_j=c_j(E_j, A_j)を最適化するように設計される.ここで,学習をC(t+1)=C(t)+λΔC/Δtでとしてシステムの最適化を行うプロセスであると定義すると,その中で各エージェントはc_j(t+1)=c_j(t)+ηΔc_j/Δtによって個々の最適化をはかる.ここで,ΔC/Δt=(ΔC/Δc_j)(Δc_J/Δt)であるから,Δc_j/Δt=KΔC/Δtによって更新される.r(t)=ΔC/Δtとすれば,r(t)はシステムの利得と考えられるから,各エージェントに対してr(t)はシステムからの報酬となり,報酬を受け取り各エージェントは自身の行動を最適化して行く.従って,このプロセスが各エージェントの学習であることが明確となった.今,各エージェントが認識できる環境をS_j=Ob(E_j),エージェントは外界に対して意志決定のために作成するモデルをM_j,このモデルから作られる自身の評価をc_j,エージェントの行動をB_j,評価から行動を決定する関数をG_j,とすれば,学習エージェントはA_j=(S_j, M_j, c_j, B_j, G_j, r, C)により構成できるようになる.このとき,c_j=c_j(S_j, B_j)となる.これらから,学習・適応戦略を持つマルチエージェントシステム問題は,MAP=(E, A, S, M, c, B, r, C)によって記述できる結果が得られた.本結果は,精密工学会秋期全国大会で詳細を公表する予定である. 上記の理論的考察を進める一方で,実際の学習・適応戦略を持つ生産システムエージェント問題として,以下の二つの問題の解決を計った.(1)無人搬送車(AGV)の衝突回避知識の学習獲得問題を,衝突知識の学習獲得問題の逆問題として取り扱い,Q学習によって学習AGVを実現した.(2)生産システムにおける在庫システムである物流システムの設計システムを,マルチエージェントシステム問題として定義し,オブジェクト指向プログラミングを利用して開発した.これらの成果は,(1)についてはFAIM'02国際研究集会,(2)については精密工学会春期全国大会,にてその公表を行った.
|