研究概要 |
当核年度の研究成果はつぎのように要約される. (1)遺伝的アルゴリズムの挙動解析について 遺伝的アルゴリズムはマルコフ過程であり,突然変異を除外した場合,吸収マルコフ過程となる.2bit-2個体問題に対しては最適解への吸収確率を解析的に求めることが可能であり,これより交叉の導入が最適解への吸収確率の現象をもたらすだまし問題が存在することおよびだまし境界を明らかにした. 集団サイズが十分大きい条件のもとでは,個体群の成長を微分方程式で記述することができ,染色体の種類が2種の場合について厳密解を導いた.また2bit問題を対象に交叉の役割を解析し,初期分布によっては最適種への収束が保証されないことを明らかにした. (2)強化学習のモデルについて 強化学習のモデルは環境同定型と経験強化型の2つに類別される.状態変数が離散的で状態遷移がマルコフ的な場合について,profit sharingと呼ばれる経験強化型学習における強化関数の最適性を理論的に解析した.また環境同定型学習法としてk確実探査法と呼ぶ新しい方式を提案し,その有効性を明らかにした. また,状態空間が連続で状態遷移がマルコフ的な場合について,割引き勾配法と呼ぶ学習アルゴリズムを提案し,いくつかの実験により,Q-learningに比べて効率化かつ安定な挙動を示すことを確認した.
|