• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Annual Research Report

ファイナンスにおける時系列データ解析のための強化学習に関する研究

Research Project

Project/Area Number 23700182
Research InstitutionChubu University

Principal Investigator

松井 藤五郎  中部大学, 生命健康科学部, 講師 (90366443)

Keywords人工知能 / 機械学習 / 強化学習
Research Abstract

本研究では,試行錯誤に基づく機械学習の枠組みである強化学習において,学習者(エージェント)が獲得する利益率(リターン)の複利効果を最大化する行動規則を学習する強化学習の枠組みである「複利型強化学習」の枠組みを開発した.複利型強化学習では,報酬の替わりに利益率を観測するマルコフ決定過程において,将来の利益率を二重指数関数を用いて割り引いたものから得られる割引複利利益率に基づいて,割引複利利益率の対数の期待値を最大化する.利益率を二重指数的に割り引くことによって,割引複利利益率の対数を従来の強化学習における指数的に割り引かれた報酬に基づく割引収益の期待値と同様に再帰的に表すことができる.複利型強化学習では,投資比率の概念を導入することによって学習が発散することを防いでいる.本研究では,オンライン勾配法を用いて複利型強化学習の投資比率を学習中に最適化する方法も開発した.
本研究では,開発した複利型強化学習の枠組みに合わせて,従来のQ学習,Sarsa,OnPSなどの強化学習アルゴリズムを複利型に拡張した.複利型強化学習の枠組みは,従来の強化学習の拡張であるため,従来の強化学習アルゴリズムを自然な形で複利型に拡張することができる.
本研究では,これらの複利型強化学習アルゴリズムをN本腕バンディット,ブラックジャック,国債銘柄選択,国債取引,株式取引などの問題に応用した.これらの実験によって,従来の強化学習が平均利益率は高いが複利効果が低い行動を学習するのに対し,複利型強化学習は平均利益率が低くても複利効果が高い行動を学習できることが確認できた.また,オンライン勾配法によって最適な投資比率を学習できることが確認できた.

  • Research Products

    (8 results)

All 2013 2012 Other

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (5 results) Book (1 results)

  • [Journal Article] 複利型強化学習における投資比率の最適化2013

    • Author(s)
      松井藤五郎
    • Journal Title

      人工知能学会論文誌

      Volume: 28 Pages: 267-272

    • DOI

      10.1527/tjsai.28.267

    • Peer Reviewed
  • [Journal Article] Compound Reinforcement Learning: Theory and an Application to Finance2012

    • Author(s)
      Tohgoroh Matsui
    • Journal Title

      Lecture Notes in Computer Science

      Volume: 7188 Pages: 321-332

    • DOI

      10.1007/978-3-642-29946-9_31

    • Peer Reviewed
  • [Presentation] 複利型強化学習による危険回避行動の学習2013

    • Author(s)
      松井藤五郎
    • Organizer
      第27回人工知能学会全国大会 (JSAI2013)
    • Place of Presentation
      富山
    • Year and Date
      20130604-20130607
  • [Presentation] 複利型強化学習の株式取引への応用2013

    • Author(s)
      後藤卓, 松井藤五郎, 大澄祥広
    • Organizer
      第27回人工知能学会全国大会 (JSAI2013)
    • Place of Presentation
      富山
    • Year and Date
      20130604-07
  • [Presentation] 最急降下法を用いたCDSプロキシヘッジにおける最適ヘッジ比率の学習2012

    • Author(s)
      後藤卓
    • Organizer
      第26回人工知能学会全国大会 (JSAI2012)
    • Place of Presentation
      山口
    • Year and Date
      20120612-20120615
  • [Presentation] 複利型強化学習における投資比率の最適化2012

    • Author(s)
      松井藤五郎
    • Organizer
      第26回人工知能学会全国大会 (JSAI2012)
    • Place of Presentation
      山口
    • Year and Date
      20120612-20120615
  • [Presentation] 複利型強化学習における投資比率最適化手法の検討

    • Author(s)
      松井藤五郎
    • Organizer
      第9回ファイナンスにおける人工知能応用研究会 (SIG-FIN)
    • Place of Presentation
      横浜
  • [Book] シミュレーション辞典2012

    • Author(s)
      日本シミュレーション学会
    • Total Pages
      452
    • Publisher
      コロナ社

URL: 

Published: 2014-07-24  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi