研究課題
Springerから出版された書籍では,強化学習問題のための分布推定アルゴリズムEDA-RLについては,状態行動遷移系列中の冗長系列を削除するアルゴリズムの成果発表を行った.この冗長系列削除機構により,大規模問題にも適用可能となり,ある不完全知覚問題のクラスについては解消可能であることが判明した.これらの結果はに収められることとなった.この結果は,解説記事として,システム制御情報学会のシステム/制御/情報にも納められる予定である.強化学習問題への適用として,多様体学習の有用性について検討を行った.競技が行われているMario AIに適用した.これはEDA-RLにも拡張できるものとみており,検討を進めている.また,他の問題クラスとして,ボードゲームのオセロや,不完全情報ゲームの麻雀などへの適用も検討を行った.昨年度,グラフカーネルを用いた分布推定アルゴリズムについては,基本アルゴリズムの実装が終了した.問題の種類を増やして,WCCI2014にて成果発表を行った.GPGPUの実装については,コーディングに不慣れなこともあり,予想より高速化が図れなかった.25年度も検討を続ける予定にある.
2: おおむね順調に進展している
昨年度から出てきている研究成果について,徐々に,論文誌へと研究成果をまとめつつあり,三年間という研究期間を考えると,順調に進展していると考えられる.
論文誌への成果発表を念頭において,データの拡充,実験結果のとりまとめを行っていく.多様体学習の適用についてSSCI2013,麻雀への適用について検討した結果をCEC2013にて発表するつもりである.PCクラスタの方がGPGPUより使い勝手よいため,PCクラスタの拡充を検討していく.
「該当なし」
すべて 2013 2012
すべて 雑誌論文 (4件) (うち査読あり 2件) 学会発表 (7件) 図書 (1件)
International Journal of Advancements in Computing Technology(IJACT)
巻: 4(22) ページ: 223-229
10.4156/ijact.vol4.issue22.25
知能と情報
巻: 24(6) ページ: 224-229
計測と制御
巻: 51(8) ページ: 765-770
Adaptation, Learning, and Optimization
巻: 14 ページ: 227-239
10.1007/978-3-642-28900-2_14