研究課題
若手研究(B)
本研究では,強化学習において利益率の複利効果を最大化するために複利型強化学習という新しい強化学習の枠組みを開発した.複利型強化学習を国債銘柄選択,国債取引,株式取引,n本腕バンディット,ブラックジャックなどに応用し,複利型強化学習がファイナンスやギャンブルのドメインに有効であることを確認した.また,複利型強化学習で導入された投資比率パラメーターをオンライン勾配法によって最適化する手法を開発した.
すべて 2013 2012 2011 その他
すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (9件) 備考 (1件)
人工知能学会論文誌,
巻: Vol.28 ページ: 267-272
DOI:10.1527/tjsai.28.267
Lecture Notesin Computer Science
巻: Vol. 7188,10 ページ: 1007/978- 3- 642- 29946- 9_31
情報処理学会論文誌
巻: Vol. 52 ページ: 3300-3308
http://id.nii.ac.jp/1001/00079533/
http://jphttp://1056lab.org