2012 Fiscal Year Research-status Report
分布推定アルゴリズムの対象領域・解表現形式の拡張とその展開
Project/Area Number |
23700267
|
Research Institution | Kinki University |
Principal Investigator |
半田 久志 近畿大学, 理工学部, 准教授 (60304333)
|
Keywords | 進化計算 |
Research Abstract |
Springerから出版された書籍では,強化学習問題のための分布推定アルゴリズムEDA-RLについては,状態行動遷移系列中の冗長系列を削除するアルゴリズムの成果発表を行った.この冗長系列削除機構により,大規模問題にも適用可能となり,ある不完全知覚問題のクラスについては解消可能であることが判明した.これらの結果はに収められることとなった.この結果は,解説記事として,システム制御情報学会のシステム/制御/情報にも納められる予定である. 強化学習問題への適用として,多様体学習の有用性について検討を行った.競技が行われているMario AIに適用した.これはEDA-RLにも拡張できるものとみており,検討を進めている.また,他の問題クラスとして,ボードゲームのオセロや,不完全情報ゲームの麻雀などへの適用も検討を行った. 昨年度,グラフカーネルを用いた分布推定アルゴリズムについては,基本アルゴリズムの実装が終了した.問題の種類を増やして,WCCI2014にて成果発表を行った.GPGPUの実装については,コーディングに不慣れなこともあり,予想より高速化が図れなかった.25年度も検討を続ける予定にある.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
昨年度から出てきている研究成果について,徐々に,論文誌へと研究成果をまとめつつあり,三年間という研究期間を考えると,順調に進展していると考えられる.
|
Strategy for Future Research Activity |
論文誌への成果発表を念頭において,データの拡充,実験結果のとりまとめを行っていく.多様体学習の適用についてSSCI2013,麻雀への適用について検討した結果をCEC2013にて発表するつもりである.PCクラスタの方がGPGPUより使い勝手よいため,PCクラスタの拡充を検討していく.
|
Expenditure Plans for the Next FY Research Funding |
「該当なし」
|
Research Products
(12 results)