1994 Fiscal Year Annual Research Report
Project/Area Number |
05452356
|
Research Institution | TOKYO INSTITUTE OF TECHNOLOGY |
Principal Investigator |
小林 重信 東京工業大学, 大学院総合理工学研究科, 教授 (40016697)
|
Co-Investigator(Kenkyū-buntansha) |
山村 雅幸 東京工業大学, 大学院総合理工学研究科, 助手 (00220442)
|
Keywords | 遺伝的アルゴリズム / サブツアー交換交叉 / 多目的最適化 / 強化学習 / 経験強化型学習 / 環境同定型学習 / k確実探査法 / 不完全知覚問題 |
Research Abstract |
1)遺伝的アルゴリズムにおける交叉の役割の解析 simple GAを対象に2bit-2個体の集団の挙動を吸収マルコフ過程として定式化し,最小騙し問題(minimal deceptive problems:MDPs)対する挙動を解析した結果,交叉によって最適解への収束が向上するための必要十分条件を導き,騙し境界定理としてまとめた. 2)形質遺伝を重視したサブツアー交換交叉の提案とその応用 順序づけ問題を対象に形質遺伝を重視した交叉方法としてサブツアー交換交叉を提案した.サブツアー交換交叉を巡回セールスマン問題およびジョブショップスケジューリング問題に適用して,その有効性を確認した. 3)遺伝的アルゴリズムによる多目的最適化 GAが集団として解を維持することに着目して,現世代の中で非パレート最適解な個体のみを淘汰する戦略に従い,パレート最適解集合を効率よく見いだす方法を開発し,パレート最適な決定木集合を求める問題に適用し,その有効性を確認した. 4)経験強化型学習の合理性についての理論的考察 経験強化型学習のprofit sharingでは報酬を得るまでのステップ数と報酬の分配率を対応づける関数を強化関数と呼んでいる.本研究ではこの強化関数について,報酬を得る上で無駄なルールは強化すべきではないという局所的な合理性および必ずいくらかの報酬を続けて得るという大局的な合理性を満足するための必要十分条件を導いた. 5)環境同定を指向した行動決定戦略:k確実探査法とその拡張 環境同定を極端に重視した方法としてk確実探査法を提案した.k確実探査法ではある状態である行動をとったときに別の状態に遷移する状態遷移確率の推定値と報酬の期待値に関する統計情報を保持し,不確実性の高い部分に焦点を合わせて行動を決定する.
|
-
[Publications] 小林重信: "遺伝的アルゴリズムの現状と課題" 計測と制御. 32. 2-9 (1993)
-
[Publications] 山村雅幸,小林重信: "遺伝的アルゴリズムの工学的応用" 人工知能学会誌. 9. 506-511 (1994)
-
[Publications] 小林重信,山村雅幸: "遺伝的アルゴリズムの探索と学習" 日本ロボット学会誌. 13. 57-62 (1995)
-
[Publications] Yamamura,M.,Satoh,H.and Kobayashi,S.: "An Analysis of Crossover's Effect in Genetic Algorithms" Proc.of 1st IEEE Conf.on Evolutionary Computation. 613-618 (1994)
-
[Publications] Sato,H.,Yamamura,M.and Kobayashi,S.: "An Analysis of Genetic Algorithms with Population Dynamics" Proc.of 3rd Int.Conf.on Fuzzy Logic,Neural Nets and Soft Computing. 449-452 (1994)
-
[Publications] Miyazaki,K.,Yamamura,M.and Kobayashi,S.: "On the Rationality of Profit Sharing in Reinforcement Learming" Proc.of 3rd Int.Conf.on Fuzzy Logic,Neural Nets and Soft Computing. 285-288 (1994)
-
[Publications] Kimura,H.,Yamamura,M.and Kobayashi,S.: "Reinforcement Learning with Delayed Rewards on Continuous State Space" Proc.of 3rd Int.Conf.on Fuzzy Logic,Neural Nets and Soft Computing. 289-292 (1994)
-
[Publications] 小林重信,山村雅幸(分担執筆): "遺伝的アルゴリズム" 産業図書, 328 (1993)