2014 Fiscal Year Research-status Report

人間認知の適応的特性を実装した価値関数の提案と大規模コンピューティングへの応用

Research Project

Project/Area Number	25730150
Research Institution	Tokyo Denki University
Principal Investigator	高橋達二東京電機大学, 理工学部, 准教授 (00514514)
Project Period (FY)	2013-04-01 – 2016-03-31
Keywords	因果帰納 / 強化学習 / モンテカルロ木探索 / n本腕バンディット問題
Outline of Annual Research Achievements	3年間の研究の2年目であった2014年度は、(3) 2013年に本格的に導入した人間認知の適応的特性を実装した価値関数である「LSモデル」の詳細な分析を行った論文を出版した。また、(4) 強化学習に引き続き、大規模コンピューティングへの応用の一つとして、モンテカルロ木探索への応用を行った。(4)は三年目の2015年度に計画していたものである。 (3) LS モデルの理論的分析、認知的検証、そして n 本腕バンディット問題での詳細な性能検証これまで不明であったLS モデルの理論的な性質を経験ベイズ法を用いた分析により明らかにした。LSモデルが実際に「人間認知の適応的特性を実装した価値関数」である点についてメタ分析と実験により示した。この結果は人工知能学会論文誌に発表した。 (4) モンテカルロ木探索への応用 (LST) (1-3) で研究を進めたLS モデルについて、モンテカルロ木探索への適用を行った。モンテカルロ木探索は最近将棋や囲碁などのボードゲームAIの制作に必須のものとなっているが、様々な問題や改善すべき点がある。 LST の性質はこれを補うものでありうる。本項目の研究に関しては国際会議 ICNAAM 2014 で発表し、また雑誌論文を投稿中である。
Current Status of Research Progress	Current Status of Research Progress 1: Research has progressed more than it was originally planned. Reason 2014年度に投稿したモンテカルロ木探索の論文が出版されれば、当初の研究計画は、一通りは達成したこととなるからである。
Strategy for Future Research Activity	LS モデルの更なる一般化 (LSVR, LSX) や強化学習への本格的な適用 (RLLS)、また LS を単純化し、完全な理論的分析を与えられる見込みのある RS モデルについての研究は、この研究全体の意味を非常に強めるものであるため、これらを最終年度に進めていく。
Causes of Carryover	計画よりも研究が順調に進行したため、前倒し支払い請求をしたための調整である。
Expenditure Plan for Carryover Budget	論文出版のための英文校正費用や投稿料として使用する予定である。

Research Products
(5 results)

All 2015

All Journal Article (5 results) (of which Peer Reviewed: 5 results, Open Access: 2 results, Acknowledgement Compliant: 5 results)

[Journal Article] 緩い対称性を持つ因果的価値関数の認知的妥当性とN本腕バンディット問題におけるその有効性2015
- Author(s)
  大用庫智, 市野学, 高橋達二
- Journal Title
  
  人工知能学会論文誌
  
  Volume: 30, 2 Pages: 403--416
- Peer Reviewed / Open Access / Acknowledgement Compliant
[Journal Article] How Do Humans Handle the Dilemma of Exploration and Exploitation in Sequential Decision Making?2015
- Author(s)
  Namiki, N., Oyo, K., Takahashi, T.
- Journal Title
  
  Proceedings of 8th International Conference on Bio-inspired Information and Communications Technologies (formerly BIONETICS
  
  Volume: 10.4108 Pages: 258045
- DOI
  10.4108/icst.bict.2014.258045
- Peer Reviewed / Open Access / Acknowledgement Compliant
[Journal Article] Causal Cognition in Game Tree Search2015
- Author(s)
  Oyo, K., Noguchi, N., Takahashi, T.
- Journal Title
  
  AIP Proceedings of 12th International Conference of Numerical Analysis and Applied Mathematics (ICNAAM 2014)
  
  Volume: 1648 Pages: 580003
- DOI
  10.1063/1.4912811
- Peer Reviewed / Acknowledgement Compliant
[Journal Article] A Satisficing Strategy with Variable Reference in the Multi-armed Bandit Problems2015
- Author(s)
  Kohno, Y., Takahashi, T.
- Journal Title
  
  AIP Proceedings of 12th International Conference of Numerical Analysis and Applied Mathematics (ICNAAM 2014)
  
  Volume: 1648 Pages: 580007
- DOI
  10.1063/1.4912815
- Peer Reviewed / Acknowledgement Compliant
[Journal Article] Information Utilization in the Artificial Bee Colony Algorithm on Noisy Landscapes2015
- Author(s)
  Ozawa, Y., Kohno, Y., Takahashi, T.
- Journal Title
  
  AIP Proceedings of 12th International Conference of Numerical Analysis and Applied Mathematics (ICNAAM 2014)
  
  Volume: 1648 Pages: 580004
- DOI
  10.1063/1.4912812
- Peer Reviewed / Acknowledgement Compliant

2014 Fiscal Year Research-status Report

人間認知の適応的特性を実装した価値関数の提案と大規模コンピューティングへの応用

Principal Investigator

高橋 達二 東京電機大学, 理工学部, 准教授 (00514514)

Current Status of Research Progress

Reason

Research Products

[Journal Article] 緩い対称性を持つ因果的価値関数の認知的妥当性とN本腕バンディット問題におけるその有効性2015

Author(s)

Journal Title

[Journal Article] How Do Humans Handle the Dilemma of Exploration and Exploitation in Sequential Decision Making?2015

Author(s)

Journal Title

DOI

[Journal Article] Causal Cognition in Game Tree Search2015

Author(s)

Journal Title

DOI

[Journal Article] A Satisficing Strategy with Variable Reference in the Multi-armed Bandit Problems2015

Author(s)

Journal Title

DOI

[Journal Article] Information Utilization in the Artificial Bee Colony Algorithm on Noisy Landscapes2015

Author(s)

Journal Title

DOI

高橋達二東京電機大学, 理工学部, 准教授 (00514514)