研究課題/領域番号 |
23500288
|
研究機関 | 東京電機大学 |
研究代表者 |
鶴田 節夫 東京電機大学, 情報環境学部, 教授 (00366395)
|
研究分担者 |
櫻井 義尚 東京電機大学, 情報環境学部, 助教 (30408653)
|
研究期間 (年度) |
2011-04-28 – 2015-03-31
|
キーワード | 遺伝的アルゴリズム / 強化学習 / パラメータ制御 / 適応的制御 / 最適化 / メタヒューリスティクス |
研究概要 |
本研究では、進化的手法などの先端的な最適化手法の産業応用への障害となっている「最適パラメータ設定の困難」を解決するだけでなく、最適化性能の改善を図るため、配送ルートの最適化を行う遺伝的アルゴリズム(GA)の(以下の特徴を持つ)パラメータ自動制御システム技術、より効率の良い最適化手法の開発を目的とする。これには、遺伝的アルゴリズムの解析とその改良手法の開発、強化学習によるパラメータ制御の自動学習、問題パターンの判別による最適方策(パラメータ制御)の選択、クラウド、グリッドなどによる分散・並列型の進化パラメータ自動設定システムなどの開発が必要になる。本年度は、強化学習による遺伝的アルゴリズムのパラメータ制御の自動学習手法を提案し、その論理的解析を行った。パラメータ設定手法は、パラメータを固定するパラメータ調律と動的に値を変える事により効率的な探索が可能になるパラメータ制御の2つに分類される。後者の中でも特に適応的手法は実行時に適応的にパラメータを設定するため、制御ルールを自動で獲得する事ができる。しかし、これまでに提案されている手法は、良い個体を生成した探索オペレータの選択確率を上げていくといった方法で、即時的な探索結果だけをパラメータ制御に反映させるため、近視眼的な最適化になる可能性がある。また、直接評価するための指標が必要なため、GAのパラメータ制御としては、交叉や突然変異など探索点の生成に直接関係するパラメータにしか適用できない。そこで、長期的に得られる報酬を最大化することを目的として方策を学習するアルゴリズム、強化学習を用いる事により長期的に最適なパラメータ制御の方策を適応的に獲得できる手法を提案した。また、その研究成果を国際学会において発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
遺伝的アルゴリズムのパラメータ制御手法を提案、解析し、その研究成果を国際会議において発表している。また、次のステップへ向けて、これまで開発してきた遺伝的アルゴリズムを基にして効率で実用的なパラメータ学習を実現するための解析を進めている。
|
今後の研究の推進方策 |
提案した遺伝的アルゴリズムのパラメータ自動学習方式の実験プログラムを利用してシミュレーション、データ解析を繰り返し、有効性の実証やより効率的な手法の提案を行っていく。また、本年度で実現したのはパラメータ制御の中でも探索オペレータ選択制御のみであるが、遺伝的アルゴリズムのパラメータには様々なものがある。探索オペレータの選択パラメータは個体レベルのパラメータとすると、生存個体数(探索点の数)、繁殖数(探索点の更新数)などは環境レベルのパラメータとなる。環境レベルのパラメータ制御の学習は個体レベルのパラメータとは異なる設定が必要になる。今後は、個体・環境レベルそれぞれに適した制御学習アルゴリズムを研究する。また、提案した遺伝的アルゴリズムのパラメータ制御手法を複数の研究者が多数の自律した分散コンピュータを使って、しかもいつでもどこでも実験検証できる方式およびその分散ポータルプロトの基本部分を開発した。
|
次年度の研究費の使用計画 |
本年度の予算は、旅費が想定より安くなったため、約8万円を次年度に持ち越した。これは実験用プログラムの作成などの人件費として利用する予定である。次年度は、提案方式・システムの開発・評価に向けたプロトタイプ作成・実験およびそのデータ収集整理等の研究支援者の雇用費に15万円、世界の研究動向の調査と成果発表のため、謝金として8万円、国際会議に出席する旅費として、25万円×2回が必要。また、研究成果を印刷するための費用として5万円、シミュレーションマシンのメンテナンス部品費や書籍代として2万円が必要となる。
|