2022 年度実績報告書

超適応としての高次脳機能：無限定環境へのプロアクティヴ・アウトリーチ原理の探究

公募研究

研究領域	身体－脳の機能不全を克服する潜在的適応力のシステム論的理解
研究課題/領域番号	22H04780
研究機関	東北医科薬科大学
研究代表者	坂本一寛東北医科薬科大学, 医学部, 准教授 (80261569)
研究期間 (年度)	2022-04-01 – 2024-03-31
キーワード	高次脳機能 / 強化学習 / 動的状態空間
研究実績の概要	何が起きうるか確率空間すら規定できない環境を無限定環境と呼ぶ。本研究では、これまでの成果を発展させ無限定環境へのプロアクティヴ・アウトリーチ（積極的働きかけ）原理の解明を目的とする。具体的には、これまでの動的状態空間強化学習モデルを発展させ、高次運動野の学習モデルを構築することを目的とする。ここまで学習モデルは以前サルで行なった２ターゲット探索課題と呼ばれる課題を題材に構築してきた。本課題には一試行内に様々なイベントがあるが、高い正答率を得るには以前の試行の結果に基づく必要がある。すなわち、より現実に即した学習モデルを構築するには、二重の時間の流れ、つまり、試行間の行動と正誤の履歴に基づく振る舞いの学習と試行内の各イベントにおける振る舞いの学習をどう両立させるかを克服する必要があった。この問題を解決するために、エピソード内履歴構造というものを考案した。ここで言うエピソードとは，具体的には提示刺激で特徴付けられる試行内のイベントである。モデルでは、新しいイベントが出現すれば、それに対応して記憶セット、つまり、動的に拡大・縮小するQテーブルが割り当てられる。各エピソードでの経験が十分に飽和したにも拘らず行動が一意に決定できない場合、同一エピソード内での履歴を遡って新たな状態を生成する。報酬は最終エピソードでのみ与えられるが、それに先行するエピソードでの行動は、報酬予測が引き渡されることにより学習される。このような機構を新たに設けることにより、サルが学習したようにモデルは２ターゲット探索課題を学習できた。本結果は、オープンアクセス誌Frontiers In Computational Neuroscience誌(15, 784592)において発表した。更に、補足運動野の性質をよく捉える順序行動課題を学習可能なモデルについての予備的な結果も学会等において発表した。
現在までの達成度 (区分)	現在までの達成度 (区分) 1: 当初の計画以上に進展している理由高次運動野、特に補足運動野・前補足運動野の機能を再現するには、遅延反応課題だけでなく、丹治・島（1994）による順序動作課題も学習可能でなくてはならない。現在、このような学習可能な動的状態空間モデルを構築しつつある。モデルでは、これまで著者らが提案したモデルと同様に経験飽和度と決定一意性の基準に基づき、状態空間・Qテーブルを動的に拡張する。更にここでは、新たな状態生成に、同一エピソード内での行動履歴を用いるサブモジュールと、エピソードを時間的に遡り知覚手がかりの組み合わせを用いるサブモジュールを用い、これらが並列にQテーブルを動的に拡張することで、目的とする課題の学習ができるのではないかと考えた。すでに、予備的な結果は学会等において発表した。
今後の研究の推進方策	課題を学習できることと、神経細胞活動を説明することとは同一ではない。丹治・島（1994）が明らかにした順序動作を符号化する神経細胞を強化学習の枠組みで説明するには、動的な状態をどのように生成するのか、そのための手がかりの使い方を精査する必要があるかもしれない。過去の文献、特に、個々の神経細胞の発火特性と精密に照らし合わせ、本学習モデルをブラシュアップする予定である。

研究成果

(13件)

すべて 2023 2022

すべて雑誌論文 (4件) (うち査読あり 2件、オープンアクセス 2件) 学会発表 (9件) (うち国際学会 7件、招待講演 1件)

[雑誌論文] Shape and Rule Information Is Reflected in Different Local Field Potential Frequencies and Different Areas of the Primate Lateral Prefrontal Cortex2022
- 著者名/発表者名
  Sakamoto Kazuhiro、Kawaguchi Norihiko、Mushiake Hajime
- 雑誌名
  
  Frontiers in Behavioral Neuroscience
  
  巻: 16 ページ: 750832
- DOI
  10.3389/fnbeh.2022.750832
- 査読あり / オープンアクセス
[雑誌論文] Reinforcement Learning Model With Dynamic State Space Tested on Target Search Tasks for Monkeys: Extension to Learning Task Events2022
- 著者名/発表者名
  Sakamoto Kazuhiro、Yamada Hinata、Kawaguchi Norihiko、Furusawa Yoshito、Saito Naohiro、Mushiake Hajime
- 雑誌名
  
  Frontiers in Computational Neuroscience
  
  巻: 16 ページ: 784604
- DOI
  10.3389/fncom.2022.784604
- 査読あり / オープンアクセス
[雑誌論文] 高次運動野の機能分化を説明する動的状態空間強化学習モデル2022
- 著者名/発表者名
  田村尚己, 虫明元, 坂本一寛
- 雑誌名
  
  信学技報
  
  巻: NC2022(42) ページ: 44-48
[雑誌論文] 創造性はいかに生まれるかー複雑系科学と神経生理学からの解明2022
- 著者名/発表者名
  坂本一寛
- 雑誌名
  
  大阪保険医雑誌
  
  巻: 50(669) ページ: 4-8
[学会発表] メレオロジーと強化学習の接点2023
- 著者名/発表者名
  坂本一寛
- 学会等名
  第100回日本生理学会大会
- 国際学会
[学会発表] Higher brain function research needs good questions and theories2023
- 著者名/発表者名
  Kazuhiro Sakamoto
- 学会等名
  NIPS workshop 2022 "Multi-disciplinary approach to understand neuronal network architecture for controlling motor actions"
- 国際学会
[学会発表] Multidimensional analysis of extracellular potentials in the cerebral cortex2022
- 著者名/発表者名
  Kazuhiro Sakamoto
- 学会等名
  Nara Institute of Science and Technology, Information Science, Colloquium A
- 招待講演
[学会発表] 高次運動野機能分化を再現する動的状態空間強化学習モデル [1P-310]2022
- 著者名/発表者名
  田村尚己, 虫明元, 坂本一寛
- 学会等名
  NEURO2022
- 国際学会
[学会発表] 決定一意性、学習飽和度は状態空間拡張の適切さを規定する~動的状態空間強化学習モデルとディリクレモデルとの比較 [3P-261]2022
- 著者名/発表者名
  坂本一寛, 片倉世雄, 虫明元
- 学会等名
  NEURO2022
- 国際学会
[学会発表] 機械学習を超える脳~高次脳機能の神経生理学と計算論からの展望~2022
- 著者名/発表者名
  坂本一寛
- 学会等名
  APSIPA BioSiPS Workshop 2022 in Kitami
- 国際学会
[学会発表] 高次運動野の機能分化を説明する動的状態空間強化学習モデル2022
- 著者名/発表者名
  田村尚己, 虫明元, 坂本一寛
- 学会等名
  電子情報通信学会ニューロコンピューティング)研究専門委員会
[学会発表] Increased firing variability may be an early warning signal of bifurcation in neuronal networks: Validation in action planning-related cells of monkey prefrontal cortex2022
- 著者名/発表者名
  Kazuhiro Sakamoto, Naohiro Saito, Shun Yoshida, Hajime Mushiake
- 学会等名
  Neuroscience 2022
- 国際学会
[学会発表] A dynamic, economical, and robust coding scheme in the lateral prefrontal neurons of monkeys2022
- 著者名/発表者名
  Kazuhiro Sakamoto, Naohiro Saito, Shun Yoshida, Hajime Mushiake
- 学会等名
  The 29th International Conference on Neural Information Processing
- 国際学会

2022 年度 実績報告書

超適応としての高次脳機能：無限定環境へのプロアクティヴ・アウトリーチ原理の探究

研究代表者

坂本 一寛 東北医科薬科大学, 医学部, 准教授 (80261569)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Shape and Rule Information Is Reflected in Different Local Field Potential Frequencies and Different Areas of the Primate Lateral Prefrontal Cortex2022

著者名/発表者名

雑誌名

DOI

[雑誌論文] Reinforcement Learning Model With Dynamic State Space Tested on Target Search Tasks for Monkeys: Extension to Learning Task Events2022

著者名/発表者名

雑誌名

DOI

[雑誌論文] 高次運動野の機能分化を説明する動的状態空間強化学習モデル2022

著者名/発表者名

雑誌名

[雑誌論文] 創造性はいかに生まれるか ー複雑系科学と神経生理学からの解明2022

著者名/発表者名

雑誌名

[学会発表] メレオロジーと強化学習の接点2023

著者名/発表者名

学会等名

[学会発表] Higher brain function research needs good questions and theories2023

著者名/発表者名

学会等名

[学会発表] Multidimensional analysis of extracellular potentials in the cerebral cortex2022

著者名/発表者名

学会等名

[学会発表] 高次運動野機能分化を再現する動的状態空間強化学習モデル [1P-310]2022

著者名/発表者名

学会等名

[学会発表] 決定一意性、学習飽和度は状態空間拡張の適切さを規定する~動的状態空間強化学習モデルとディリクレモデルとの比較 [3P-261]2022

著者名/発表者名

学会等名

[学会発表] 機械学習を超える脳~高次脳機能の神経生理学と計算論からの展望~2022

著者名/発表者名

学会等名

[学会発表] 高次運動野の機能分化を説明する動的状態空間強化学習モデル2022

著者名/発表者名

学会等名

[学会発表] Increased firing variability may be an early warning signal of bifurcation in neuronal networks: Validation in action planning-related cells of monkey prefrontal cortex2022

著者名/発表者名

学会等名

[学会発表] A dynamic, economical, and robust coding scheme in the lateral prefrontal neurons of monkeys2022

著者名/発表者名

学会等名

2022 年度実績報告書

坂本一寛東北医科薬科大学, 医学部, 准教授 (80261569)

[雑誌論文] 創造性はいかに生まれるかー複雑系科学と神経生理学からの解明2022