2022 年度実績報告書

内発的動機付けと社会性の統合による自然強化学習の実現

研究課題

研究課題/領域番号	20H04259
研究機関	東京電機大学
研究代表者	高橋達二東京電機大学, 理工学部, 教授 (00514514)
研究分担者	甲野佑東京電機大学, 理工学部, 研究員 (10870313) 玉造晃弘東京電機大学, 理工学部, 研究員 (10876361) 太田宏之防衛医科大学校(医学教育部医学科進学課程及び専門課程、動物実験施設、共同利用研究施設、病院並びに防衛, 薬理学, 講師 (20535190) 浦上大輔日本大学, 生産工学部, 准教授 (40458196) 大用庫智関西学院大学, 総合政策学部, 講師 (60755685)
研究期間 (年度)	2020-04-01 – 2023-03-31
キーワード	社会学習 / 因果推論 / 自然知能 / 天然知能 / 強化学習 / 模倣 / バンディット問題 / 深層強化学習
研究実績の概要	最終年度である2022年度は、自然強化学習アルゴリズムを、バンディット問題での応用、強化学習全般における検証、深層強化学習に対する全面的な適用の準備、社会学習における新しい協力・競い合いのモデリング、そしてその生物学的・神経科学的基盤の研究を進めた。またそれに加えて、限られた情報や情報処理能力、行動能力の下で世界の因果的モデルを作る因果推論についての研究を行った。これは因果推論能力を持ち環境の構造を自律的に学習できるエージェントの開発に必要である。世界モデルなど、環境構造の表現が喫緊課題となっており、また学習の効率性の観点からも関連性が高い。研究の成果としては、人工知能学会全国大会で8件、日本認知科学会大会で4件、情報処理学会全国大会で2件の発表を行い、情報処理学会では筆頭著者である指導学生が学生奨励賞を1件受賞した。因果推論については BioSystems 誌に論文を出版した。準備中・投稿中の論文としては、社会学習における論文が1編、神経科学論文が1編、新しい深層強化学習アルゴリズムを目指した工学系論文の1編が(再)投稿準備中である。ニューラルネット上での表現と転移の基礎的な論文が1編投稿中である。特に社会学習については、その科学的な含意が大きいため、集合知やガブリエル・タルドの社会モデル、ダン・スペルベルの文化進化などの観点からこの結果の意義を広範に示せるよう、準備を進めている。
現在までの達成度 (段落)	令和4年度が最終年度であるため、記入しない。
今後の研究の推進方策	令和4年度が最終年度であるため、記入しない。

研究成果

(14件)

すべて 2023 2022

すべて雑誌論文 (1件) (うち査読あり 1件、オープンアクセス 1件) 学会発表 (13件)

[雑誌論文] Causal intuition in the indefinite world: Meta-analysis and simulations2023
- 著者名/発表者名
  Higuchi Kohki、Oyo Kuratomo、Takahashi Tatsuji
- 雑誌名
  
  Biosystems
  
  巻: 225 ページ: 104842～104842
- DOI
  10.1016/j.biosystems.2023.104842
- 査読あり / オープンアクセス
[学会発表] 発話者間の関係性が条件推論の抑制に及ぼす影響 -ポライトネス理論に基づく検討-2023
- 著者名/発表者名
  小倉那央，高橋達二，中村紘子
- 学会等名
  IPSJ2023
[学会発表] 未来考慮型の信頼度に基づく合目的強化学習2023
- 著者名/発表者名
  有村柊一，南朱音，甲野佑，高橋達二
- 学会等名
  IPSJ2023
[学会発表] 複数の満足化エージェント間のわずかな情報共有による分業と最適性2022
- 著者名/発表者名
  和田拓真, 高橋達二
- 学会等名
  JSAI2022
[学会発表] 理想基準値を用いた確率的満足化方策2022
- 著者名/発表者名
  加藤暦雄, 甲野佑, 高橋達二
- 学会等名
  JSAI2022
[学会発表] 信頼度を局所的に近似する認知的満足化方策2022
- 著者名/発表者名
  南朱音, 甲野佑, 高橋達二
- 学会等名
  JSAI2022
[学会発表] スケール可能かつシンプルな深層強化学習検証タスクの開発2022
- 著者名/発表者名
  池田龍司, 南朱音, 甲野佑, 高橋達二
- 学会等名
  JSAI2022
[学会発表] 不定自然変換理論の動的特性2022
- 著者名/発表者名
  横須賀天臣, 布山美慕, 西郷甲矢人, 高橋達二
- 学会等名
  JSAI2022
[学会発表] 確率的満足化における最適な基準値の動的推定2022
- 著者名/発表者名
  久米淳, 鈴木裕毅, 加藤暦雄, 甲野祐, 高橋達二
- 学会等名
  JSAI2022
[学会発表] 希求水準の達成度合いを考慮する自然強化学習2022
- 著者名/発表者名
  越川駿平, 有村柊一, 若林洋尭, 甲野佑, 高橋達二
- 学会等名
  JSAI2022
[学会発表] 思考スタイルの個人差が条件推論に及ぼす影響の検討2022
- 著者名/発表者名
  横須賀天臣, 渡邊元樹, 高橋達二, 中村紘子
- 学会等名
  JCSS2022
[学会発表] 人間の因果的直感に基づく因果探索アルゴリズム2022
- 著者名/発表者名
  樋口滉規, 高橋達二
- 学会等名
  JCSS2022
[学会発表] 追試とメタ分析による因果帰納推論モデルの適合性評価2022
- 著者名/発表者名
  林涼太, 市野弘人, 樋口滉規, 高橋達二
- 学会等名
  JCSS2022
[学会発表] 不定自然変換理論とWord2Vecを用いた比喩生成2022
- 著者名/発表者名
  阿久津規介, 池田駿介, 布山美慕, 西郷甲矢人, 高橋達二
- 学会等名
  JCSS2022

2022 年度 実績報告書

内発的動機付けと社会性の統合による自然強化学習の実現

研究代表者

高橋 達二 東京電機大学, 理工学部, 教授 (00514514)

研究成果

[雑誌論文] Causal intuition in the indefinite world: Meta-analysis and simulations2023

著者名/発表者名

雑誌名

DOI

[学会発表] 発話者間の関係性が条件推論の抑制に及ぼす影響 -ポライトネス理論に基づく検討-2023

著者名/発表者名

学会等名

[学会発表] 未来考慮型の信頼度に基づく合目的強化学習2023

著者名/発表者名

学会等名

[学会発表] 複数の満足化エージェント間のわずかな情報共有による分業と最適性2022

著者名/発表者名

学会等名

[学会発表] 理想基準値を用いた確率的満足化方策2022

著者名/発表者名

学会等名

[学会発表] 信頼度を局所的に近似する認知的満足化方策2022

著者名/発表者名

学会等名

[学会発表] スケール可能かつシンプルな深層強化学習検証タスクの開発2022

著者名/発表者名

学会等名

[学会発表] 不定自然変換理論の動的特性2022

著者名/発表者名

学会等名

[学会発表] 確率的満足化における最適な基準値の動的推定2022

著者名/発表者名

学会等名

[学会発表] 希求水準の達成度合いを考慮する自然強化学習2022

著者名/発表者名

学会等名

[学会発表] 思考スタイルの個人差が条件推論に及ぼす影響の検討2022

著者名/発表者名

学会等名

[学会発表] 人間の因果的直感に基づく因果探索アルゴリズム2022

著者名/発表者名

学会等名

[学会発表] 追試とメタ分析による因果帰納推論モデルの適合性評価2022

著者名/発表者名

学会等名

[学会発表] 不定自然変換理論とWord2Vecを用いた比喩生成2022

著者名/発表者名

学会等名

2022 年度実績報告書

高橋達二東京電機大学, 理工学部, 教授 (00514514)