研究課題
研究課題の一つである強化学習問題のための分布推定アルゴリズムEDA-RLでは,これまでの成果をまとめたものをシステム情報制御学会の学会誌に解説記事として掲載された.特に,冗長系列の削減に力点を置いて記述した.また,強化学習問題への多様体学習の適用についても,電気学会の学会誌に解説記事を出すことが出来た.本研究課題の先見性が認められつつあると考えている.また,強化学習問題への適用として,多様体学習の他に,特徴抽出を行うためにDeep Boltzmann Machinesの利用を検討した.これは,ビデオゲームの一つであるMario AI championshipに適用し,性能向上を確認することが出来た.グラフカーネルを用いた分布推定アルゴリズムについて,エッジに重みがある場合について検討を行った.これは,未発表ではあるが,研究課題終了後,順次発表を行っていくことを予定している.GPGPUの活用は最後まで有用な結果を示すことができなかった.細粒度のスレッド処理を効率的に使えなかったことによる.内定をいただいた,次年度からの基盤(C)の課題では,コア数の多いXeon(24コア・48スレッド)での適用を検討する.
すべて 2013
すべて 雑誌論文 (4件) (うち査読あり 2件) 学会発表 (4件)
システム/制御/情報 : システム制御情報学会誌
巻: 57 ページ: 402-407
Adaptive Dynamic Programming And Reinforcement Learning (ADPRL), 2013 IEEE Symposium on
巻: なし ページ: 70 - 176
10.1109/ADPRL.2013.6615004
Nature and Biologically Inspired Computing (NaBIC), 2013 World Congress on
巻: なし ページ: 147 - 152
10.1109/NaBIC.2013.6617853
電気学会誌
巻: 133 ページ: 356-359
10.1541/ieejjournal.133.356