1993 Fiscal Year Annual Research Report
Project/Area Number |
05213202
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
小林 重信 東京工業大学, 大学院・総合理工学研究科, 教授 (40016697)
|
Co-Investigator(Kenkyū-buntansha) |
山村 雅幸 東京工業大学, 大学院・総合理工学研究科, 助手 (00220442)
|
Keywords | 遺伝的アルゴリズム / 巡回セールスマン問題 / ジョブショップスケジューリング問題 / 部分順序交換交叉 / ポートフォリオ選択問題 / 強化学習 / 環境同定型学習 / 経験強化型学習 |
Research Abstract |
当該年度の研究成果はつぎのように要約される. (1)遺伝的アルゴリズムによる組み合わせ的最適化 遺伝的アルゴリズムが潜在的にもつバランスの取れた探索能力を引き出すためには,コード化と交叉の設計が重要であるとの立場から,巡回セールスマン問題やスケジューリング問題などの順序づけ問題に対し汎用的に使える交叉方法として部分順序交換交叉を提案した.Fisher & Thompsonの10×10問題に適用し,非常に高い確率で最適解が導けることを示した. また,ポートフォリオ選択問題を対象に遺伝的アルゴリズムによるモデル化を試みて,2次計画法で得られる厳密解に十分近い近似解を導けることを示した.さらに,有効フロンティアを効率よく求める方法を提案した. (2)強化学習のモデルについて 強化学習のモデルは環境同定型と経験強化型の2つに類別される.状態変数が離散的で状態遷移がマルコフ的な場合について,profit sharingと呼ばれる経験強化型学習における強化関数の最適性を理論的に解析した.また環境同定型学習法としてk確実探査法と呼ぶ新しい方式を提案し,その有効性を明らかにした. また,状態空間が連続で状態遷移がマルコフ的な場合について,割引き勾配法と呼ぶ学習アルゴリズムを提案し,いくつかの実験により,Q-learningに比べて効率的かつ安定な挙動を示すことを確認した.
|
-
[Publications] 小林重信: "遺伝的アルゴリズムの現状と認識" 計測と制御. 32. 2-9 (1993)
-
[Publications] 小林重信: "遺伝的アルゴリズムの基礎と応用" オペレーションズ・リサーチ. 38. 256-261 (1993)
-
[Publications] 小林重信,小野功,山村雅幸: "遺伝的アルゴリズムによるジョブショップスケジューリングの性能評価" 生産スケジューリングシンポジウム講演論文集. 27-32 (1993)
-
[Publications] 小林重信,寺野隆雄: "知能システム技術の展望" 計測と制御. 33. 1-8 (1994)
-
[Publications] 木村元,山村雅幸,小林重信: "状態空間が連続で報酬入力に遅れのある強化学習" 第5回自律分散システムシンポジウム資料. 9-14 (1994)
-
[Publications] 佐藤浩,山村雅幸,小林重信: "遺伝的アルゴリズムの数理生態学的解析" 第5回自律分散システムシンポジウム資料. 123-128 (1994)
-
[Publications] 宮崎和光,山村雅幸,小林重信: "強化学習における報酬割当の理論的考察" 人工知能学会誌. 9(掲載予定). (1994)
-
[Publications] 森泰樹,山村雅幸,小林重信: "遺伝的アルゴリズムによるポートフォリオ選択" 第19回知能システムシンポジウム. (発表予定). (1994)