• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2017 Fiscal Year Annual Research Report

強化学習理論に基づく問題解決のモデル化と創造的問題解決の認知機序の解明

Research Project

Project/Area Number 16H01725
Research InstitutionThe University of Tokyo

Principal Investigator

植田 一博  東京大学, 大学院総合文化研究科, 教授 (60262101)

Co-Investigator(Kenkyū-buntansha) 鮫島 和行  玉川大学, 付置研究所, 教授 (30395131)
福田 玄明  東京大学, 大学院総合文化研究科, 助教 (40615100)
Project Period (FY) 2016-04-01 – 2020-03-31
Keywords認知科学 / 実験系心理学 / 学習心理学 / 脳・神経
Outline of Annual Research Achievements

強化学習の計算理論における重要なパラメータとして,学習の速さを決定する学習率αと,「既得情報の利用と新規情報の探索」のバランス,すなわち情報探索傾向を決定する逆温度βとがある.この2つのパラメータおよび不確実性をどの程度受容するかというリスク志向性によって特徴付けられる認知機構は,強化学習そのものや意思決定のみならず,問題解決の説明原理にもなり得るという仮説の検証をいくつかの課題に対して行った.
創造性課題について上記の仮説を検証するために,創造性を測るための3種類のアイデア生成課題を参加者に課し,回答を5つの評価項目で評価した.さらに,強化学習課題(ギャンブリング課題),ハノイの塔課題,コイン場所当て課題も課し,これらの課題を特徴づけるパラメータや成績と創造性の評価との関連性を調べた.その結果,強化学習課題においてリスクを気にしない参加者ほどアイデアを多数生成すること,およびコイン場所当て課題における学習の大きさとアイデア生成課題の独自性との間に関連性があることがわかった.
さらに洞察課題について上記の仮説を検証するために,洞察課題であるマッチ棒課題と強化学習課題(ギャンブリング課題)を参加者に課し,ギャンブリング課題から得られた意思決定に関わるパラメータの個人差からマッチ棒課題の成績を予測できることを明らかにした.特に,ギャンブリング課題のパフォーマンスを強化学習によって説明するのが適切なreinforcement learnerと教師付き学習によって説明するのが適切なsupervised learnerとの間でマッチ棒課題のパフォーマンスを比較したところ,前者の方が後者よりも優れていることがわかった.この結果は,洞察が強化学習の基盤となっている認知機構に支えられている可能性を示唆している.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

一部の実験で望ましい結果が出ていないものの,当初予定していた実験を順調に実施し,分析も進んでいる.研究成果の発表も順調に行われている.そのため,上記のように判断した.

Strategy for Future Research Activity

強化学習の計算理論における重要なパラメータとして,学習の速さを決定する学習率αと「既得情報の利用と新規情報の探索」のバランスを決定する逆温度βがある.この2つのパラメータによって特徴付けられる認知機構は,強化学習そのものや意思決定のみならず,問題解決の説明原理にもなり得るという仮説を,創造的問題解決,洞察問題解決,通常の問題解決のそれぞれに対して検証する.
具体的には,実験参加者に各課題を解いてもらい,それぞれのパフォーマンスを示す指標(通常の問題解決では正答率と正答時間,洞察問題解決では正答率,正答時間,制約緩和率,創造的問題解決ではuniquenessの視点や,第三者評定に基づく独創性や有用性などの得点)を個人ごとに抽出する.また,Behrens et al. (2008)などで用いられている山賊問題(bandit task)も実施してもらい,学習率αと逆温度βを個人ごとに推定する.そして,問題解決のパフォーマンスを示す各指標と学習率αおよび逆温度βとの間に相関(βの場合には逆相関)があるかどうかを検討する.特に,山賊問題の実験設定を変更した上で,迷路探索課題など昨年度実施していない問題に対しても検討を行い,かつ問題解決者の学習をタイプ分類(supervised learnerかreinforcement learnerか)した上で分析することで,実験結果の頑健性を担保する(心理実験).
仮説通り,問題解決者および問題解決のタイプによって問題解決パフォーマンスと逆温度βとの間に関係が見いだされた場合,当該の問題解決には右前頭極が関与している可能性が考えられる.そこで,右前頭極の活動を経頭蓋電気刺激によりコントロールすることで,新規情報探索傾向およびこれらの問題解決のパフォーマンスが変化するかどうかを検討する(脳計測実験).

  • Research Products

    (35 results)

All 2018 2017 Other

All Journal Article (8 results) (of which Peer Reviewed: 7 results,  Open Access: 2 results) Presentation (26 results) (of which Int'l Joint Research: 4 results,  Invited: 2 results) Remarks (1 results)

  • [Journal Article] Real Objects Can Impede Conditional Reasoning but Augmented Objects Do Not2018

    • Author(s)
      Sato Yuri、Sugimoto Yutaro、Ueda Kazuhiro
    • Journal Title

      Cognitive Science

      Volume: 42 Pages: 691~707

    • DOI

      10.1111/cogs.12553

    • Peer Reviewed
  • [Journal Article] Strategy Analysis of Non-consequence Inference with Euler Diagrams2018

    • Author(s)
      Sato Yuri、Wajima Yuichiro、Ueda Kazuhiro
    • Journal Title

      Journal of Logic, Language, and Information

      Volume: 27 Pages: 61~77

    • DOI

      10.1007/s10849-017-9259-x

    • Peer Reviewed
  • [Journal Article] Is the Extension of Trading Hours Always Beneficial? An Artificial Agent-Based Analysis2017

    • Author(s)
      Miwa Kotaro、Ueda Kazuhiro
    • Journal Title

      Computational Economics

      Volume: 50 Pages: 595~627

    • DOI

      10.1007/s10614-016-9613-0

    • Peer Reviewed
  • [Journal Article] なじみ深さのマッチング: 認知プロセスと生態学的合理性の実験的検討2017

    • Author(s)
      白砂 大、松香 敏彦、本田 秀仁、植田 一博
    • Journal Title

      認知科学

      Volume: 24 Pages: 328~343

    • DOI

      10.11225/jcss.24.328

    • Peer Reviewed / Open Access
  • [Journal Article] ヒューリスティックの集合知: 集団意思決定の視点に基づく適応性の理論的分析2017

    • Author(s)
      藤崎 樹、本田 秀仁、植田 一博
    • Journal Title

      認知科学

      Volume: 24 Pages: 284~299

    • DOI

      10.11225/jcss.24.284

    • Peer Reviewed / Open Access
  • [Journal Article] The difference in foresight using the scanning method between experts and non-experts2017

    • Author(s)
      Honda Hidehito、Washida Yuichi、Sudo Akihito、Wajima Yuichiro、Awata Keigo、Ueda Kazuhiro
    • Journal Title

      Technological Forecasting and Social Change

      Volume: 119 Pages: 18~26

    • DOI

      10.1016/j.techfore.2017.03.005

    • Peer Reviewed
  • [Journal Article] Memory-Based Simple Heuristics as Attribute Substitution: Competitive Tests of Binary Choice Inference Models2017

    • Author(s)
      Honda Hidehito、Matsuka Toshihiko、Ueda Kazuhiro
    • Journal Title

      Cognitive Science

      Volume: 41 Pages: 1093~1118

    • DOI

      10.1111/cogs.12395

    • Peer Reviewed
  • [Journal Article] Cognitive Mechanism in Selecting New Products: A Cognitive Neuroscience Perspective2017

    • Author(s)
      Ueda Kazuhiro
    • Journal Title

      Emotional Engineering

      Volume: 5 Pages: 31~41

    • DOI

      10.1007/978-3-319-53195-3_4

  • [Presentation] Measure of the Ability Dominance of Tournament Systems and Subjective Judgment2018

    • Author(s)
      Maekawa Tomoyuki、Honda Hidehito、Ueda Kazuhiro
    • Organizer
      The 10th International Conference on Knowledge and Smart Technology
    • Int'l Joint Research
  • [Presentation] Decisions based on verbal probabilities: Decision bias or decision by sampling?2017

    • Author(s)
      Honda Hidehito、Matsuka Toshihiko、Ueda Kazuhiro
    • Organizer
      The 39th Annual Conference of the Cognitive Science Society
    • Int'l Joint Research
  • [Presentation] On an effective and efficient method for exploiting “wisdom of crowds in one mind.”2017

    • Author(s)
      Fujisaki Itsuki、Honda Hidehito、Ueda Kazuhiro
    • Organizer
      The 39th Annual Conference of the Cognitive Science Society
    • Int'l Joint Research
  • [Presentation] Familiarity-matching in decision making: Experimental studies on cognitive processes and analyses of ecological rationality2017

    • Author(s)
      Shirasuna Masaru、Honda Hidehito、Matsuka Toshihiko、Ueda Kazuhiro
    • Organizer
      The 39th Annual Conference of the Cognitive Science Society
    • Int'l Joint Research
  • [Presentation] なじみ深さのマッチング:familiarityの類似性に基づく選択2017

    • Author(s)
      白砂 大、本田 秀仁、松香 敏彦、植田 一博
    • Organizer
      日本認知心理学会第15回大会
  • [Presentation] 個人内で集合知を生み出す認知的手法の提案2017

    • Author(s)
      藤崎 樹、本田 秀仁、植田 一博
    • Organizer
      日本認知心理学会第15回大会
  • [Presentation] フレーム選択における意図と潜在的処理2017

    • Author(s)
      本田 秀仁、白砂 大、松香 敏彦、植田 一博
    • Organizer
      日本認知心理学会第15回大会
  • [Presentation] アンカリング効果の発生原因は数字か意味か2017

    • Author(s)
      大貫 祐太郎、新垣 紀子、本田 秀仁、植田 一博
    • Organizer
      日本認知心理学会第15回大会
  • [Presentation] コグニティブ・マーケティング:消費者の行動と認知から隠れた選好を読み解く2017

    • Author(s)
      植田 一博
    • Organizer
      第4回大和証券・東京大学未来金融フォーラム
    • Invited
  • [Presentation] なじみ深さ, 知識―統計モデルによる推論プロセスの検証―2017

    • Author(s)
      白砂 大、本田 秀仁、松香 敏彦、植田 一博
    • Organizer
      日本認知科学会第34回大会
  • [Presentation] 異なる評価法によるリスク態度の変化:意思決定者の信念推定に基づく認知プロセスの分析2017

    • Author(s)
      大貫 祐大郎、本田 秀仁、松香 敏彦、植田 一博
    • Organizer
      日本認知科学会第34回大会
  • [Presentation] “レモン”より“檸檬”を買いたい:日本語表記の希少性と可読性が食品認知に与える影響2017

    • Author(s)
      本田 秀仁、藤崎 樹、植田 一博
    • Organizer
      日本認知科学会第34回大会
  • [Presentation] 多様性が導く集合知:集団意思決定の視点に基づく理論的分析2017

    • Author(s)
      藤崎 樹、本田 秀仁、植田 一博
    • Organizer
      日本認知科学会第34回大会
  • [Presentation] 生成された現在の状態に関する情報の価値を評価するためのタスクによらない目的関数の提案2017

    • Author(s)
      須藤 明人、藤原 直哉、徳田 慶太、本田 秀仁、植田 一博
    • Organizer
      日本認知科学会第34回大会
  • [Presentation] 認知科学な視点に基づくユーザイノベーションとデジタルマーケティング2017

    • Author(s)
      植田 一博
    • Organizer
      東京大学・科学・技術交流サロン
    • Invited
  • [Presentation] “どのような”から“なぜ”の問いへ:言語確率が生み出す決定バイアスの再考2017

    • Author(s)
      本田 秀仁、松香 敏彦、植田 一博
    • Organizer
      行動経済学会第11回大会
  • [Presentation] 言葉の力で支援を届ける:言語確率が寄付行動に与える影響2017

    • Author(s)
      顧 元琪、本田 秀仁、植田 一博
    • Organizer
      行動経済学会第11回大会
  • [Presentation] 推論ストラテジーの多様性がもたらす集合知:計算機シミュレーションを通じた分析2017

    • Author(s)
      藤崎 樹、本田 秀仁、植田 一博
    • Organizer
      行動経済学会第11回大会
  • [Presentation] お礼に“損失”を感じる受け取り方:行為の違いによって生じる非言語フレーミング効果2017

    • Author(s)
      大貫 祐大郎、本田 秀仁、植田 一博
    • Organizer
      行動経済学会第11回大会
  • [Presentation] 文楽人形遣いの非言語情報を用いた“型”動作の伝達2017

    • Author(s)
      櫻 哲郎、渋谷 友紀、植田 一博
    • Organizer
      HCGシンポジウム2017
  • [Presentation] インタラクションにおける他者選好推定-限られた事例からのモデル生成-2017

    • Author(s)
      足立原 功太、福田 玄明、植田 一博
    • Organizer
      HCGシンポジウム2017
  • [Presentation] ゲーム内のエージェントに対する名前の付け方と呼名がインタラクション内容に与える影響2017

    • Author(s)
      野島 慎哉、本田 秀仁、植田 一博
    • Organizer
      HCGシンポジウム2017
  • [Presentation] 洞察問題解決と強化学習における試行錯誤との関連性2017

    • Author(s)
      野並 新、福田 玄明、佐藤 好幸、鮫島 和行、植田 一博
    • Organizer
      HCGシンポジウム2017
  • [Presentation] 勝敗決定方式の実力支配度合いと観戦における面白さの判断2017

    • Author(s)
      前川 知行、本田 秀仁、植田 一博
    • Organizer
      HCGシンポジウム2017
  • [Presentation] 創造性,問題解決,および学習に関わる認知プロセスの関連性2017

    • Author(s)
      佐藤 好幸、福田 玄明、野並 新、鮫島 和行、植田 一博
    • Organizer
      HCGシンポジウム2017
  • [Presentation] ゾロ目にどのような意味を見出すか?-判断・意思決定に与える影響-2017

    • Author(s)
      本田 秀仁、松永 聡太、植田 一博
    • Organizer
      HCGシンポジウム2017
  • [Remarks] 植田一博研究室

    • URL

      http://www.cs.c.u-tokyo.ac.jp/

URL: 

Published: 2018-12-17  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi