1993 Fiscal Year Annual Research Report
Project/Area Number |
05452356
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
小林 重信 東京工業大学, 大学院・総合理工学研究科, 教授 (40016697)
|
Co-Investigator(Kenkyū-buntansha) |
山村 雅幸 東京工業大学, 大学院・総合理工学研究科, 助手 (00220442)
|
Keywords | 遺伝的アルゴリズム / マルコフ解析 / 数理生態学的解析 / だまし境界定理 / 強化学習 / profit sharing / Q-learing / 割引き勾配法 |
Research Abstract |
当核年度の研究成果はつぎのように要約される. (1)遺伝的アルゴリズムの挙動解析について 遺伝的アルゴリズムはマルコフ過程であり,突然変異を除外した場合,吸収マルコフ過程となる.2bit-2個体問題に対しては最適解への吸収確率を解析的に求めることが可能であり,これより交叉の導入が最適解への吸収確率の現象をもたらすだまし問題が存在することおよびだまし境界を明らかにした. 集団サイズが十分大きい条件のもとでは,個体群の成長を微分方程式で記述することができ,染色体の種類が2種の場合について厳密解を導いた.また2bit問題を対象に交叉の役割を解析し,初期分布によっては最適種への収束が保証されないことを明らかにした. (2)強化学習のモデルについて 強化学習のモデルは環境同定型と経験強化型の2つに類別される.状態変数が離散的で状態遷移がマルコフ的な場合について,profit sharingと呼ばれる経験強化型学習における強化関数の最適性を理論的に解析した.また環境同定型学習法としてk確実探査法と呼ぶ新しい方式を提案し,その有効性を明らかにした. また,状態空間が連続で状態遷移がマルコフ的な場合について,割引き勾配法と呼ぶ学習アルゴリズムを提案し,いくつかの実験により,Q-learningに比べて効率化かつ安定な挙動を示すことを確認した.
|
-
[Publications] 小林重信: "遺伝的アルゴリズムの現状と認識" 計測と制御. 32. 2-9 (1993)
-
[Publications] 小林重信: "遺伝的アルゴリズムの基礎と応用" オペレーションズ・リサーチ. 38. 256-261 (1993)
-
[Publications] 小林重信,小野功,山村雅幸: "遺伝的アルゴリズムによるジョブショップスケジューリングの性能評価" 生産スケジューリングシンポジウム講演論文集. 27-32 (1993)
-
[Publications] 山村雅幸: "強化学習" 人工知能学会誌. 8. 833-834 (1993)
-
[Publications] 木村元,山村雅幸,小林重信: "状態空間が連続で報酬入力に遅れのある強化学習" 第5回自律分散システムシンポジウム資料. 9-14 (1994)
-
[Publications] 佐藤浩,山村雅幸,小林重信: "遺伝的アルゴリズムの数理生態学的解析" 第5回自律分散システムシンポジウム資料. 123-128 (1994)
-
[Publications] 宮崎和光,山村雅幸,小林重信: "強化学習における報酬割当の理論的考察" 人工知能学会誌. 9(掲載予定). (1994)
-
[Publications] 中川浩史,山村雅幸,小林重信: "遺伝的アルゴリズムの世代交替と多様性維持について" 第19回知能システムシンポジウム. (発表予定). (1994)