研究概要 |
学習エージェントのモデルに関する理論的な考察を展開した.ここで作成した学習エージェントは,A=(Σ,Ω,B,M)で表現される.ここで,AΣ,Ω,B及びMはそれぞれ適応プランの集合,プラン選択器,選択行動パターンの集合,環境の測度をあらわす.これらの関係は,Σ:Ω×M→Ω及びM=μ(Ω)であり,μ(Ω)は選択されたプランΩによる環境の評価である.このモデルでは,エージェントの行動パターンB(i)が与えられるとプラン選択器Σはプラン集合AからプランΩ(i+1)を決定し,このプランに基づいてエージェントの行動パターンB(i+1)を決定し,その行動が環境評価μ(Ω(i+1)によって評価されるサイクルによって適応的にプラン戦略が進化するものである.本研究は,毎年米国セントルイスで開催されるArtificial Neural Networks in Engineering 2004 (ANNIE'04)において公表され,優秀論文賞(The First Runner Up Award)を受賞した. また,自己組織化による生産システムの研究として自己組織化マップによる学習を利用したn台のAGVの配送計画経路問題の解法を開発した.本研究では,自己組織化マップのシナップスベクトル近傍結合が自由曲線のスプライン関数の結合式に類似することに注目し,B-スプライン関数で使用される多重ノットの概念を自己組織化マップのニューロンに導入した.ここで取り扱った問題は基本的にn人の巡回セールスマン問題(n-TSP)となるため,n台のAGVの始点終点を多重ニューロンとして経路計算を実施した所,n-TSPの解法として使用したm-step 2-opt法と比較して優れた結果を得ることが検証された.
|