研究課題/領域番号 |
05452356
|
研究種目 |
一般研究(B)
|
配分区分 | 補助金 |
研究分野 |
知能情報学
|
研究機関 | 東京工業大学 |
研究代表者 |
小林 重信 東京工業大学, 大学院・総合理工学研究所, 教授 (40016697)
|
研究分担者 |
山村 雅幸 東京工業大学, 大学院・総合理工学研究所, 助手 (00220442)
|
研究期間 (年度) |
1993 – 1994
|
研究課題ステータス |
完了 (1994年度)
|
配分額 *注記 |
5,600千円 (直接経費: 5,600千円)
1994年度: 2,100千円 (直接経費: 2,100千円)
1993年度: 3,500千円 (直接経費: 3,500千円)
|
キーワード | 遺伝的アルゴリズム / コード化・交叉の役割 / 組合せ最適化 / 多目的最適化 / 強化学習 / profit sharing / k確実探査法 / 不完全知覚問題 / サブツアー交換交叉 / 経験強化型学習 / 環境同定型学習 / マルコフ解析 / 数理生態学的解析 / だまし境界定理 / Q-learing / 割引き勾配法 |
研究概要 |
(1)進化型計算に関する研究成果 1)遺伝的アルゴリズムにおける交叉の役割の解析 交叉オペレータが探索に果たす役割を理論的に解析し、騙し境界定理を導いた。 2)コード化・交叉の評価基範の提案 モデル化の評価基範として完備性・健全性・非冗長性・形質遺伝性を提案した。 3)形質遺伝を重視したサブツアー交換交叉の提案とその応用 順序づけ問題を対象に形質遺伝性に優れたサブツアー交換交叉を提案した。 4)遺伝的アルゴリズムによる多目的最適化 多目的最適化問題の合理解であるパレート最適集合をGAで求める方法を確立した。 (2)適応学習に関する研究成果 1)強化学習の枠組みおよびカテゴリーの明確化 強化学習の枠組みを明確化し、環境のクラスと接近の指向性による分類を行った。 2)経験強化型学習の合理性についての理論的考察 profit sharingにおける強化関数の合理性に関して理論的な解析を行った。 3)環境同定を指向した行動決定戦略:k確実探査法とその拡張 未知のマルコフ環境を効率よく同定する行動決定戦略としてk-確実法を提案した 4)期待報酬の山登りによる強化学習 期待報酬の勾配を手がかりに逐次的に山登りを行う強化学習法を提案した。 5)不完全知覚下での学習 感覚器の不完全さによる知覚騙しに対し状態遷移を予測するモデルを開発した。
|