2021 Fiscal Year Annual Research Report

Natural reinforcement learning integrating intrinsic motivation and sociality

Research Project

Project/Area Number	20H04259
Research Institution	Tokyo Denki University
Principal Investigator	高橋達二東京電機大学, 理工学部, 教授 (00514514)
Co-Investigator(Kenkyū-buntansha)	甲野佑東京電機大学, 理工学部, 研究員 (10870313) 玉造晃弘東京電機大学, 理工学部, 研究員 (10876361) 太田宏之防衛医科大学校(医学教育部医学科進学課程及び専門課程、動物実験施設、共同利用研究施設、病院並びに防衛, 薬理学, 講師 (20535190) 浦上大輔日本大学, 生産工学部, 准教授 (40458196) 大用庫智関西学院大学, 総合政策学部, 講師 (60755685)
Project Period (FY)	2020-04-01 – 2023-03-31
Keywords	社会学習 / 強化学習 / 天然知能 / 因果推論 / バンディット問題 / 満足化
Outline of Annual Research Achievements	2021年度の繰越分として、自然強化学習アルゴリズムを、バンディット問題での応用、強化学習全般における検証、深層強化学習に対する全面的な適用の準備、社会学習における新しい協力・競い合いのモデリング、そしてその生物学的・神経科学的基盤の研究を進めた。またそれに加えて、限られた情報や情報処理能力、行動能力の下で世界の因果的モデルを作る因果推論についての研究を行った。これは因果推論能力を持ち環境の構造を自律的に学習できるエージェントの開発に必要である。世界モデルなど、環境構造の表現が喫緊課題となっており、また学習の効率性の観点からも関連性が高い。研究の成果としては、ジャーナル論文3本などがある。社会学習については、その科学的な含意が大きいため、集合知やガブリエル・タルドの社会モデル、ダン・スペルベルの文化進化などの観点からこの結果の意義を広範に示せるよう、準備を進めている。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason コロナ禍のための実験の遅れなどはあったものの、理論的にも、研究発表に関しても、順調に進んでいる。
Strategy for Future Research Activity	理論的な一般化が進んだので、より多くの分野への適用や応用が可能になることが大いに期待される。そのため、まずは可能な含意を引き出し、またエンジニアリング的に難しい面もあるので、効率的に進める。

Research Products
(3 results)

All 2022 2021

All Journal Article (3 results) (of which Peer Reviewed: 3 results, Open Access: 3 results)

[Journal Article] Softsatisficing: Risk-sensitive softmax action selection2022
- Author(s)
  Kamiya Takumi、Takahashi Tatsuji
- Journal Title
  
  Biosystems
  
  Volume: 213 Pages: 104633～104633
- DOI
  10.1016/j.biosystems.2022.104633
- Peer Reviewed / Open Access
[Journal Article] Conveying Intention by Motions With Awareness of Information Asymmetry2022
- Author(s)
  Fukuchi Yosuke、Osawa Masahiko、Yamakawa Hiroshi、Takahashi Tatsuji、Imai Michita
- Journal Title
  
  Frontiers in Robotics and AI
  
  Volume: 9 Pages: 783863
- DOI
  10.3389/frobt.2022.783863
- Peer Reviewed / Open Access
[Journal Article] The asymmetric learning rates of murine exploratory behavior in sparse reward environments2021
- Author(s)
  Ohta Hiroyuki、Satori Kuniaki、Takarada Yu、Arake Masashi、Ishizuka Toshiaki、Morimoto Yuji、Takahashi Tatsuji
- Journal Title
  
  Neural Networks
  
  Volume: 143 Pages: 218～229
- DOI
  10.1016/j.neunet.2021.05.030
- Peer Reviewed / Open Access

2021 Fiscal Year Annual Research Report

Natural reinforcement learning integrating intrinsic motivation and sociality

Principal Investigator

高橋 達二 東京電機大学, 理工学部, 教授 (00514514)

Current Status of Research Progress

Reason

Research Products

[Journal Article] Softsatisficing: Risk-sensitive softmax action selection2022

Author(s)

Journal Title

DOI

[Journal Article] Conveying Intention by Motions With Awareness of Information Asymmetry2022

Author(s)

Journal Title

DOI

[Journal Article] The asymmetric learning rates of murine exploratory behavior in sparse reward environments2021

Author(s)

Journal Title

DOI

高橋達二東京電機大学, 理工学部, 教授 (00514514)