• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Generative adversarial brain: a comprehensive study of multi-agent learning by natural and artificial intelligence

Research Project

Project/Area Number 22H04998
Research Category

Grant-in-Aid for Scientific Research (S)

Allocation TypeSingle-year Grants
Review Section Broad Section J
Research InstitutionKyoto University

Principal Investigator

石井 信  京都大学, 情報学研究科, 教授 (90294280)

Co-Investigator(Kenkyū-buntansha) 森本 淳  京都大学, 情報学研究科, 教授 (10505986)
Seymour Ben  株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 研究員 (10644057)
吉田 和子  株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 客員研究員 (30379599)
Parmas Paavo  東京大学, 大学院工学系研究科(工学部), 特任助教 (50936309)
雨森 賢一  京都大学, 高等研究院, 特定拠点准教授 (70344471)
Project Period (FY) 2022-04-27 – 2027-03-31
Project Status Granted (Fiscal Year 2025)
Budget Amount *help
¥193,570,000 (Direct Cost: ¥148,900,000、Indirect Cost: ¥44,670,000)
Fiscal Year 2025: ¥35,100,000 (Direct Cost: ¥27,000,000、Indirect Cost: ¥8,100,000)
Fiscal Year 2024: ¥37,440,000 (Direct Cost: ¥28,800,000、Indirect Cost: ¥8,640,000)
Fiscal Year 2023: ¥39,520,000 (Direct Cost: ¥30,400,000、Indirect Cost: ¥9,120,000)
Fiscal Year 2022: ¥49,920,000 (Direct Cost: ¥38,400,000、Indirect Cost: ¥11,520,000)
Keywords計算神経科学 / 敵対生成ネットワーク / 意思決定 / モデルベース強化学習 / 知能ロボティクス / 敵対生成脳 / 強化学習 / ロボティクス / 計算論的神経科学 / 敵対的生成ネットワーク / Artificial Intelligence / Meta learning / Agile robotics / Artificial intelligence
Outline of Research at the Start

人工知能技術の進展により、画像、音声、言語などの認識系では人間の能力を凌駕することに成功したが、未だ一般化知能の実現には遠い。運動系や意思決定系などではビッグデータを準備することは一般に困難であり、高サンプル効率の学習法の導出に期待されている。本研究では、高等生物脳の高サンプル効率の学習を理論化しようとする「敵対生成脳」を作業仮説とし、その脳内機構をヒト・霊長類の計算神経科学研究により明らかにし、機械学習アルゴリズムとして導出、さらに、人と共創するロボティクスに応用するという学際的な研究を進める。環境に複数のエージェントが存在する状況(マルチエージェント環境)への展開も進める。

Outline of Annual Research Achievements

(a) 敵対深層学習に基づき尤度と事前知識を制御可能な画像生成法を開発、ヒトの脳識別器機構を調べた。画像の尤度は脳の初期視覚野と高次視覚野により処理され、事前知識はデフォールトモードネットワークが関わることが分かった(論文投稿中)。被験者間で選好が異なるマルチエージェント意思決定課題を用いて、ヒト行動・イメージング実験を行い、他者モデルの脳内学習を説明するための計算モデルの構築を進めた。さらに、複数の画像特徴量からなる人工文字をオンライン的に生成推論する課題の作成を終え、被験者30人の行動・イメージング実験を完了した。 サル脳内の識別器機構を明らかにするため、経験に基づく自己の行動選好と行動観察に基づいて推定される他者の行動選好を統合する社会的意思決定課題を開発、行動実験を進めた。サルの社会ランクの違いに応じた、うつ・不安の神経過程を調べた。ゲノムワイド関連解析のメタ解析により、関連する脳領野の同定を行った(Karunakaran et al., 2023)。
(b) モデルベース強化学習法PIPPSに、潜在空間による世界モデルを学習するDreamerを組み合わせることで、サンプル効率の優れた制御学習手法を導出した(Parmas et al., 2023)。また、マルチエージェント模倣学習の方法論についての検討を進めた。各エージェントの役割同定と、同一役割のデータ群からの行動戦略模倣を行うことにより、マルチエージェントの動作方策が獲得されることを確認した。
(c) リカレント型ニューラルネットワークと深層強化学習を階層的に組み合わせることで、環境に応じて歩容を変化させることのできる4脚ロボットシミュレータの歩行学習法を開発、論文投稿した。さらに、敵対生成脳の学習法を導入したものは、状態の外乱に対して非常に強い耐性を有することが分かった(Goto et al., 2023)。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究課題は、3つのサブ研究課題(計算神経科学、人工知能、知能ロボティクス)からなる融合・学際的研究を進めるものであるが、項目6に記載の通り、全てのサブ課題において、順調に研究が進展している。
なお、コロナ禍の影響は軽減したものの、人の脳活動計測装置が本格稼働していなかったことで実験実施に困難が生じたなどの理由で、実験費の一部を次年度(2024年度)に繰り越した。しかし、期間延長に伴い実験は全て完了しており、関連して、投稿中の論文の多くは2024年度末頃に論文掲載されることとなった(次年度以降に報告)。すなわち、繰り越しに伴う2023年度計画の研究の遅れは完全になくなっている。

Strategy for Future Research Activity

ヒトを用いた計算神経科学の研究は順調であり、今後、脳内生成器の特徴づけの研究、また、マルチエージェント環境での実験とモデル化に展開する。また、識別器機能の不調がヒト精神疾患のリスクになり得るとの仮説の下での新規研究も継続的に進める。サルを用いた計算神経科学の研究はサル-サルは実験的に容易でないことが分かったので、サル-ヒトと微修正を加えた上で、行動・神経生理実験を継続実施中である。
人工知能研究は、サンプル効率の高い強化学習法の導出に成功したので、それに敵対生成モデルを組み合わせることでサンプル効率と頑健性の両者を実現する学習系の構成を目指す。
知能ロボティクス研究では、敵対生成学習による、四脚ロボットシミュレータの制御のロバスト化に成功したので、本手法の実機制御に展開する。また、この考え方はドメインランダマイゼーションなど潜在空間モデルを用いた強化学習法と思想が近いので、数理的に新規で、かつ実機制御にも利用可能なアルゴリズムの開発として継続的に研究を進める。

Assessment Rating
Interim Assessment

A: 順調に研究が進展しており、期待どおりの成果が見込まれる

Report

(5 results)
  • 2024 Interim Assessment (Comments) ( PDF )
  • 2023 Annual Research Report
  • 2022 Abstract ( PDF )   Comments on the Screening Results   Annual Research Report
  • Research Products

    (22 results)

All 2023 2022 Other

All Int'l Joint Research (3 results) Journal Article (7 results) (of which Int'l Joint Research: 3 results,  Peer Reviewed: 7 results,  Open Access: 7 results) Presentation (11 results) (of which Int'l Joint Research: 9 results) Remarks (1 results)

  • [Int'l Joint Research] Oxford University(英国)

    • Related Report
      2023 Annual Research Report
  • [Int'l Joint Research] Oxford University(英国)

    • Related Report
      2022 Annual Research Report
  • [Int'l Joint Research] 深セン大学(中国)

    • Related Report
      2022 Annual Research Report
  • [Journal Article] Triangle Inequality for Inverse Optimal Control2023

    • Author(s)
      Mitsuhashi Sho、Ishii Shin
    • Journal Title

      IEEE Access

      Volume: 11 Pages: 119187-119199

    • DOI

      10.1109/access.2023.3327426

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Deep Adversarial Reinforcement Learning Method to Generate Control Policies Robust Against Worst-Case Value Predictions2023

    • Author(s)
      Ohashi Kohei、Nakanishi Kosuke、Yasui Yuji、Ishii Shin
    • Journal Title

      IEEE Access

      Volume: 11 Pages: 100798-100809

    • DOI

      10.1109/access.2023.3314750

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] The Brain/MINDS Marmoset Connectivity Resource: An open-access platform for cellular-level tracing and tractography in the primate brain2023

    • Author(s)
      Skibbe Henrik、Rachmadi Muhammad Febrian、Nakae Ken、Gutierrez Carlos Enrique、Hata Junichi、Tsukada Hiromichi、Poon Charissa、Schlachter Matthias、Doya Kenji、Majka Piotr、Rosa Marcello G. P.、Okano Hideyuki、Yamamori Tetsuo、Ishii Shin、Reisert Marco、Watakabe Akiya
    • Journal Title

      PLOS Biology

      Volume: 21 Issue: 6 Pages: 1-37

    • DOI

      10.1371/journal.pbio.3002158

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Spatiotemporal expression patterns of anxiety disorder-associated genes2023

    • Author(s)
      Karunakaran Kalyani B.、Amemori Ken-ichi
    • Journal Title

      Translational Psychiatry

      Volume: 13 Issue: 1 Pages: 385-385

    • DOI

      10.1038/s41398-023-02693-y

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Transition Motion Synthesis for Object Interaction based on Learning Transition Strategies2022

    • Author(s)
      Jaepyung Hwang, Gangrae Park, Taesoo Kwon, Shin Ishii
    • Journal Title

      Computer Graphics Forum

      Volume: 41 Issue: 6 Pages: 37-50

    • DOI

      10.1111/cgf.14499

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Tri-view two-photon microscopic image registration and deblurring with convolutional neural networks2022

    • Author(s)
      Lee Sehyung、Kume Hideaki、Urakubo Hidetoshi、Kasai Haruo、Ishii Shin
    • Journal Title

      Neural Networks

      Volume: 152 Pages: 57-69

    • DOI

      10.1016/j.neunet.2022.04.011

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Deep learning-based image deconstruction method with maintained saliency2022

    • Author(s)
      Fujimoto, K., Hayashi, K., Katayama, R., Lee, S., Liang, Z., Yoshida, W., Ishii, S.
    • Journal Title

      Neural Networks

      Volume: 155 Pages: 224-241

    • DOI

      10.1016/j.neunet.2022.08.015

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Presentation] Model-based reinforcement learning with scalable composite policy gradient estimators.2023

    • Author(s)
      Parmas, P., Seno, T., Aoki, Y.
    • Organizer
      International Conference on Machine Learning,
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] EEG study on anticipation of difficulty for upcoming auditory task.2023

    • Author(s)
      Song, Z., Higashi, H., Ishii, S.
    • Organizer
      2023 Asia Pacific Signal and Information Processing Association Annual Summit and Conference.
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] The neural bases of prior and likelihood uncertainty.2023

    • Author(s)
      Hayashi, K., Katayama, R., Fujimoto, K., Yoshida, W., Ishii, S.
    • Organizer
      2023 IBRO Neuroscience Reports, 2140.
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Value-based decision-making relying on uncertain prior information.2023

    • Author(s)
      Katayama, R., Ishii, S.
    • Organizer
      2023 IBRO Neuroscience Reports, 2759.
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Deep adversarial reinforcement learning and its application to adaptive control of a locomotive robot.2023

    • Author(s)
      Goto, N., Kubo, A., Ohashi, K., Watanabe, T., Nakanishi, K., Yasui, Y., Nakamura, Y., Ishii, S.
    • Organizer
      22nd World Congress of the International Federation of Automatic Control.
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Selective silencing of the ventral striatum-ventral pallidum pathway enhances approach choices and motivational states under approach-avoidance conflict in nonhuman primates.2023

    • Author(s)
      Oh, J.N., Amemori, S., Inoue, K.-I., Kimura, K., Takada, M., Amemori, K.
    • Organizer
      Society for Neuroscience, abstract, PSTR040.13
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Reduced top-down influence in the primate fronto-cingulo-striatal network underlying negative bias in conflict decision-making.2023

    • Author(s)
      Amemori, S., Greybiel, A.M., Amemori, K.
    • Organizer
      Society for Neuroscience, abstract, PSTR423.17
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Orbitofrontal and anterior cingulate circuits in primates: complementary roles in cost-benefit decision-making and learning.2023

    • Author(s)
      Papageorgiou, G.K., Gibson, D., Amemori, K, Schwardt, H., Wang, M.C., Sharma, J., Greybiel, A.M.
    • Organizer
      Society for Neuroscience, Abstract PSTR040.06
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] 暗黙的マルチタスクRLのための方策適合.2023

    • Author(s)
      山森聡, 森本淳
    • Organizer
      第26回情報論的学習理論ワークショップ(IBIS2023)
    • Related Report
      2023 Annual Research Report
  • [Presentation] パラメータ空間でのネットワーク混合を用いたマルチタスク強化学習による汎化方策群の獲得.2023

    • Author(s)
      後藤祐汰, 山森聡, 八木聡明, 森本淳
    • Organizer
      第26回情報論的学習理論ワークショップ(IBIS2023).
    • Related Report
      2023 Annual Research Report
  • [Presentation] The cognitive basis of pain: Arbitration between body-model and world-model pain avoidance learning2023

    • Author(s)
      Yan, Y., Hewitt, D., Hunt, L., Seymour, B.
    • Organizer
      Conference on Cognitive Computational Neuroscience
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Remarks]

    • URL

      https://ishiilab.jp/member/ishii/

    • Related Report
      2022 Annual Research Report

URL: 

Published: 2022-04-28   Modified: 2026-01-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi