研究課題/領域番号 |
23700267
|
研究機関 | 岡山大学 |
研究代表者 |
半田 久志 岡山大学, 自然科学研究科, 助教 (60304333)
|
研究期間 (年度) |
2011-04-28 – 2014-03-31
|
キーワード | 分布推定アルゴリズム / 進化計算 / 強化学習問題 / グラフカーネル / グラフマイニング |
研究概要 |
強化学習問題のための分布推定アルゴリズムEDA-RLについては,状態行動遷移系列中の冗長系列を削除するアルゴリズムの実装を行った.この冗長系列削除機構により,大規模問題にも適用可能となり,ある不完全知覚問題のクラスについては解消可能であることが判明した.これらの結果はSpringerから出版された書籍に収められることとなった. グラフカーネルを用いた分布推定アルゴリズムについては,基本アルゴリズムの実装が終了した.このアルゴリズムは,既存の進化アルゴリズムをグラフ関連問題に適用した際に顕在する1)似たような遺伝子型が全く異なった表現型をしてしまう.そして,2)鏡像解など,一見ことなった遺伝子型が,同じもしくは類似した表現型になってしまうことによる,適応度景観の凸凹さを解消できるとがわかった.この基本アルゴリズムのアイデアを台湾で開催された国際シンポジウムでKeynote speechとして紹介することができた.しかしながら,この実装では,計算量低減の副産物としてエッジが増大する方向にバイアスがかかっており,それを解消するためにはギブスサンプリングを実装する必要があることがわかった.ギブスサンプリングは計算量がかかるため,GPGPUの実装による評価を先に行う必要があることがわかり,それに関して前倒し請求を行い,GPGPUの実装に関する研究に着手することになった.これについては,現在も実装中である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
強化学習問題のための分布推定アルゴリズムであるEDA-RLについては,冗長系列削除機構の実装とその評価が完了し,さらにその成果が十分に認められ書籍(分担執筆)の出版まで行っていることから順調な滑り出しを見せているといえる. グラフカーネルを用いた分布推定アルゴリズムについても,基本アルゴリズムの実装は完了していることから良好に進展していると考えている.
|
今後の研究の推進方策 |
強化学習問題のための分布推定アルゴリズムEDA-RLについて,多目的最適化の考え方を用いた多戦略の獲得について考察してくことを考えている.「グラフカーネルを用いた分布推定アルゴリズム」に関しては,GPGPUに対応させたアルゴリズムをベンチマーク問題へ適用し,GPGPU化の効果,アルゴリズムの性能検証を行う.ギブスサンプリング以外にも,計算量が少なく,かつバイアスがかからないサンプリング方法を案出する必要があると考えている.
|
次年度の研究費の使用計画 |
グラフカーネルを用いた分布推定アルゴリズムの基本アルゴリズムについて,6月に開催されるWorld Congress on Computational Intelligence (WCCI 2012)にて成果発表を行う予定にしている. また,Ivy Bridge Core i7 搭載のPCを複数台購入し,PCクラスタを構築する予定にしている. さらに,次々年度の応用に向けて,他大学教員との意見交換を活発に行って行きたいと考えている.
|