研究概要 |
1)遺伝的アルゴリズムにおける交叉の役割の解析 simple GAを対象に2bit-2個体の集団の挙動を吸収マルコフ過程として定式化し,最小騙し問題(minimal deceptive problems:MDPs)対する挙動を解析した結果,交叉によって最適解への収束が向上するための必要十分条件を導き,騙し境界定理としてまとめた. 2)形質遺伝を重視したサブツアー交換交叉の提案とその応用 順序づけ問題を対象に形質遺伝を重視した交叉方法としてサブツアー交換交叉を提案した.サブツアー交換交叉を巡回セールスマン問題およびジョブショップスケジューリング問題に適用して,その有効性を確認した. 3)遺伝的アルゴリズムによる多目的最適化 GAが集団として解を維持することに着目して,現世代の中で非パレート最適解な個体のみを淘汰する戦略に従い,パレート最適解集合を効率よく見いだす方法を開発し,パレート最適な決定木集合を求める問題に適用し,その有効性を確認した. 4)経験強化型学習の合理性についての理論的考察 経験強化型学習のprofit sharingでは報酬を得るまでのステップ数と報酬の分配率を対応づける関数を強化関数と呼んでいる.本研究ではこの強化関数について,報酬を得る上で無駄なルールは強化すべきではないという局所的な合理性および必ずいくらかの報酬を続けて得るという大局的な合理性を満足するための必要十分条件を導いた. 5)環境同定を指向した行動決定戦略:k確実探査法とその拡張 環境同定を極端に重視した方法としてk確実探査法を提案した.k確実探査法ではある状態である行動をとったときに別の状態に遷移する状態遷移確率の推定値と報酬の期待値に関する統計情報を保持し,不確実性の高い部分に焦点を合わせて行動を決定する.
|