• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Research-status Report

人間認知の適応的特性を実装した価値関数の提案と大規模コンピューティングへの応用

Research Project

Project/Area Number 25730150
Research InstitutionTokyo Denki University

Principal Investigator

高橋 達二  東京電機大学, 理工学部, 准教授 (00514514)

Project Period (FY) 2013-04-01 – 2016-03-31
Keywords因果帰納 / 強化学習 / モンテカルロ木探索 / n本腕バンディット問題
Outline of Annual Research Achievements

3年間の研究の2年目であった2014年度は、(3) 2013年に本格的に導入した人間認知の適応的特性を実装した価値関数である「LSモデル」の詳細な分析を行った論文を出版した。また、(4) 強化学習に引き続き、大規模コンピューティングへの応用の一つとして、モンテカルロ木探索への応用を行った。(4)は三年目の2015年度に計画していたものである。
(3) LS モデルの理論的分析、認知的検証、そして n 本腕バンディット問題での詳細な性能検証
これまで不明であったLS モデルの理論的な性質を経験ベイズ法を用いた分析により明らかにした。LSモデルが実際に「人間認知の適応的特性を実装した価値関数」である点についてメタ分析と実験により示した。この結果は人工知能学会論文誌に発表した。
(4) モンテカルロ木探索への応用 (LST)
(1-3) で研究を進めたLS モデルについて、モンテカルロ木探索への適用を行った。モンテカルロ木探索は最近将棋や囲碁などのボードゲームAIの制作に必須のものとなっているが、様々な問題や改善すべき点がある。 LST の性質はこれを補うものでありうる。
本項目の研究に関しては国際会議 ICNAAM 2014 で発表し、また雑誌論文を投稿中である。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

2014年度に投稿したモンテカルロ木探索の論文が出版されれば、当初の研究計画は、一通りは達成したこととなるからである。

Strategy for Future Research Activity

LS モデルの更なる一般化 (LSVR, LSX) や強化学習への本格的な適用 (RLLS)、また LS を単純化し、完全な理論的分析を与えられる見込みのある RS モデルについての研究は、この研究全体の意味を非常に強めるものであるため、これらを最終年度に進めていく。

Causes of Carryover

計画よりも研究が順調に進行したため、前倒し支払い請求をしたための調整である。

Expenditure Plan for Carryover Budget

論文出版のための英文校正費用や投稿料として使用する予定である。

  • Research Products

    (5 results)

All 2015

All Journal Article (5 results) (of which Peer Reviewed: 5 results,  Open Access: 2 results,  Acknowledgement Compliant: 5 results)

  • [Journal Article] 緩い対称性を持つ因果的価値関数の認知的妥当性とN本腕バンディット問題におけるその有効性2015

    • Author(s)
      大用庫智, 市野学, 高橋達二
    • Journal Title

      人工知能学会論文誌

      Volume: 30, 2 Pages: 403--416

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] How Do Humans Handle the Dilemma of Exploration and Exploitation in Sequential Decision Making?2015

    • Author(s)
      Namiki, N., Oyo, K., Takahashi, T.
    • Journal Title

      Proceedings of 8th International Conference on Bio-inspired Information and Communications Technologies (formerly BIONETICS

      Volume: 10.4108 Pages: 258045

    • DOI

      10.4108/icst.bict.2014.258045

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] Causal Cognition in Game Tree Search2015

    • Author(s)
      Oyo, K., Noguchi, N., Takahashi, T.
    • Journal Title

      AIP Proceedings of 12th International Conference of Numerical Analysis and Applied Mathematics (ICNAAM 2014)

      Volume: 1648 Pages: 580003

    • DOI

      10.1063/1.4912811

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] A Satisficing Strategy with Variable Reference in the Multi-armed Bandit Problems2015

    • Author(s)
      Kohno, Y., Takahashi, T.
    • Journal Title

      AIP Proceedings of 12th International Conference of Numerical Analysis and Applied Mathematics (ICNAAM 2014)

      Volume: 1648 Pages: 580007

    • DOI

      10.1063/1.4912815

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] Information Utilization in the Artificial Bee Colony Algorithm on Noisy Landscapes2015

    • Author(s)
      Ozawa, Y., Kohno, Y., Takahashi, T.
    • Journal Title

      AIP Proceedings of 12th International Conference of Numerical Analysis and Applied Mathematics (ICNAAM 2014)

      Volume: 1648 Pages: 580004

    • DOI

      10.1063/1.4912812

    • Peer Reviewed / Acknowledgement Compliant

URL: 

Published: 2016-06-01  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi