• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

不完全情報下での逐次的意思決定:部分観測マルコフ決定過程解法の探索

研究課題

研究課題/領域番号 20K20752
研究種目

挑戦的研究(萌芽)

配分区分基金
審査区分 中区分7:経済学、経営学およびその関連分野
研究機関電気通信大学

研究代表者

岩崎 敦  電気通信大学, 大学院情報理工学研究科, 准教授 (30380679)

研究期間 (年度) 2020-07-30 – 2023-03-31
研究課題ステータス 完了 (2022年度)
配分額 *注記
6,500千円 (直接経費: 5,000千円、間接経費: 1,500千円)
2021年度: 3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
2020年度: 2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
キーワードゲーム理論 / 繰り返しゲーム / アルゴリズム / 最適化 / 計量経済学 / 私的観測
研究開始時の研究の概要

本研究では,情報系諸分野の理論を探索して,不完全情報下における逐次的意思決定の分析手法を開拓することを目的とする.具体的には,私的観測というお互いの行動を正確に観測できない不完全観測下で繰り返し行われる意思決定をゲーム理論の枠組みで考え,そのゲームの帰結 (均衡) を求める.これは部分観測可能マルコフ決定過程に帰着できることが知られているが,解析可能な定式化や解法は未だ見つかっていない.そこで,近年発展が著しい機械学習理論/制御理論/情報理論といった諸分野の理論から,大規模な問題に適用可能な,精度保証つきの近似解法を構築する.

研究成果の概要

本研究では,不完全情報下における逐次的意思決定の分析手法を開拓することを目的とする.具体的には,私的観測というお互いの行動を正確に観測できない不完全観測下において繰り返し行われる意思決定をくり返しゲームの枠組みで考え,その帰結(均衡)を求める問題を扱う.まず,進化ゲームでよく用いられる突然変異付きレプリケータダイナミクスを利用した分析を進め,有名なしっぺ返し戦略の代わりに勝ち残り・負け逃げ戦略が優位になる条件を明らかにした.次に,そのダイナミクスの構造を利用した正則化先導者追従 (FTRL) ベースの均衡計算アルゴリズムを開発し、N人単調ゲームを扱えることを証明した.

研究成果の学術的意義や社会的意義

人がどのように協力する/しないかの仕組みは学際的な研究課題であり,繰り返しゲームは,いつ終わるかわからない相手との関係が協力を誘発するとして,その仕組みを解明する研究分野である.その中でも私的観測は,その有用性を指摘されながらも明らかになっていないことが多い研究課題である。これに対して本研究は、進化ゲームの枠組みを利用して、行動の取り違えにおける新しい戦略である単独裏切-相互処罰戦略を発見した。さらにその枠組みを学習アルゴリズムに応用し、私的観測のようなノイズ下でも均衡を計算できるアルゴリズムを開発した。

報告書

(4件)
  • 2022 実績報告書   研究成果報告書 ( PDF )
  • 2021 実施状況報告書
  • 2020 実施状況報告書
  • 研究成果

    (31件)

すべて 2023 2022 2021 2020 その他

すべて 国際共同研究 (2件) 雑誌論文 (4件) (うち国際共著 1件、 査読あり 4件、 オープンアクセス 3件) 学会発表 (24件) (うち招待講演 1件) 備考 (1件)

  • [国際共同研究] New York University(米国)

    • 関連する報告書
      2022 実績報告書
  • [国際共同研究] Northwestern University/New York University(米国)

    • 関連する報告書
      2022 実績報告書
  • [雑誌論文] Last-Iterate Convergence with Full and Noisy Feedback in Two-Player Zero-Sum Games2023

    • 著者名/発表者名
      Kenshi Abe, Kaito Ariu, Mitsuki Sakamoto, Kentaro Toyoshima, Atsushi Iwasaki
    • 雑誌名

      Proceedings of The 26th International Conference on Artificial Intelligence and Statistics

      巻: 206 ページ: 7999-8028

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 私的観測下の繰り返し囚人のジレンマにおける協力のダイナミクス2022

    • 著者名/発表者名
      西野上 和真、五十嵐 瞭平、岩崎 敦
    • 雑誌名

      情報処理学会論文誌

      巻: 63 号: 4 ページ: 1138-1148

    • DOI

      10.20729/00217615

    • 年月日
      2022-04-15
    • 関連する報告書
      2022 実績報告書 2021 実施状況報告書
    • 査読あり
  • [雑誌論文] Anytime Capacity Expansion in Medical Residency Match by Monte Carlo Tree Search2022

    • 著者名/発表者名
      Kenshi Abe, Junpei Komiyama, Atsushi Iwasaki
    • 雑誌名

      Proceedings of the 31th International Joint Conference on Artificial Intelligence (IJCAI-2022)

      巻: Main Track ページ: 3-9

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Mutation-driven follow the regularized leader for last-iterate convergence in zero-sum games2022

    • 著者名/発表者名
      Kenshi Abe, Mitsuki Sakamoto, Atsushi Iwasaki
    • 雑誌名

      Proceedings of the Thirty-Eighth Conference on Uncertainty in Artificial Intelligence PMLR

      巻: 180 ページ: 1-10

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [学会発表] オンライン環境において公平な資源配分を実現するアルゴリズムに関する研究2023

    • 著者名/発表者名
      山田博瑛, 小宮山純平, 阿部拳之, 岩﨑 敦
    • 学会等名
      情報処理学会第85回全国大会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 板垣圭知, 小宮山純平, 阿部拳之, 岩崎 敦2023

    • 著者名/発表者名
      研修医配属における地域間格差を調整するための制約のモンテカルロ木探索
    • 学会等名
      情報処理学会第85回全国大会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 公平なインターバルスケジューリング問題に関する研究2023

    • 著者名/発表者名
      酒井洸星, 岩崎 敦
    • 学会等名
      情報処理学会第85回全国大会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 村井伸一郎, 岩崎 敦2023

    • 著者名/発表者名
      取り違えのある繰り返し囚人のジレンマにおける単独裏切-相互同期戦略
    • 学会等名
      情報処理学会第85回全国大会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 二人零和ゲームにおける突然変異付きレプリケータダイナミクスを用いた学習アルゴリズムに関する研究2022

    • 著者名/発表者名
      豊島 健太郎
    • 学会等名
      人工知能学会全国大会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 取り違えのある繰り返し囚人のジレンマにおける協力のダイナミクス2022

    • 著者名/発表者名
      村井 伸一郎
    • 学会等名
      人工知能学会全国大会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 制約付きマッチングのためのデータ駆動型課税規則に関する研究2022

    • 著者名/発表者名
      岩崎 敦
    • 学会等名
      人工知能学会全国大会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 制約付きマッチングのためのデータ駆動型課税規則に関する研究2022

    • 著者名/発表者名
      岩崎 敦
    • 学会等名
      第21回情報科学技術フォーラム(選奨論文)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 二人零和ゲームにおける突然変異駆動型Follow-The-Regularized-Leaderの終極反復収束2022

    • 著者名/発表者名
      豊島 健太郎
    • 学会等名
      第21回情報科学技術フォーラム(選奨論文)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 取り違えのある繰り返し囚人のジレンマにおける協力のダイナミクス2022

    • 著者名/発表者名
      村井 伸一郎
    • 学会等名
      第21回情報科学技術フォーラム(選奨論文)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 二人零和ゲームにおける突然変異付きレプリケータダイナミクスを用いた学習アルゴリズムに関する研究2022

    • 著者名/発表者名
      坂本充生
    • 学会等名
      情報処理学会第84回全国大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] ほぼ公的観測下の繰り返しプロジェクトゲームにおける協力のダイナミクス2022

    • 著者名/発表者名
      五十嵐瞭平
    • 学会等名
      情報処理学会第84回全国大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] クールノー競争におけるマルチエージェント強化学習に関する研究2022

    • 著者名/発表者名
      豊島健太郎
    • 学会等名
      情報処理学会第84回全国大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 取り違えのある繰り返し囚人のジレンマにおける協力のダイナミクス2022

    • 著者名/発表者名
      村井伸一郎
    • 学会等名
      情報処理学会第84回全国大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 見間違えのある繰り返しゲームのためのActor-Critic型強化学習2021

    • 著者名/発表者名
      坂本充生
    • 学会等名
      第24回情報論的学習理論ワークショップ (IBIS2021)
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 見間違えのある繰り返しゲームのためのActor-Critic型強化学習2021

    • 著者名/発表者名
      坂本充生
    • 学会等名
      日本OR学会秋季研究発表会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] ほぼ公的観測下の囚人のジレンマにおける協力のダイナミクス2021

    • 著者名/発表者名
      五十嵐瞭平
    • 学会等名
      日本OR学会秋季研究発表会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 見間違えのある繰り返し囚人のジレンマにおける方策勾配法に関する研究2021

    • 著者名/発表者名
      坂本充生
    • 学会等名
      第20回情報科学技術フォーラム(選奨論文)
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] ほぼ公的観測下の繰り返し囚人のジレンマにおける協力のダイナミクス2021

    • 著者名/発表者名
      五十嵐瞭平
    • 学会等名
      第20回情報科学技術フォーラム(選奨論文)
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] ほぼ公的観測下の繰り返し囚人のジレンマにおける協力のダイナミクス2021

    • 著者名/発表者名
      五十嵐瞭平
    • 学会等名
      人工知能学会全国大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 見間違えのある繰り返し囚人のジレンマにおけるQ学習に関する研究2021

    • 著者名/発表者名
      坂本充生
    • 学会等名
      人工知能学会全国大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 反実仮想後悔最小化によるアメリカンフットボールにおけるオフェンス戦略の均衡推定2021

    • 著者名/発表者名
      島野 雄貴
    • 学会等名
      人工知能学会全国大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 見間違えのある繰り返し囚人のジレンマにおける協力の発生と振動2021

    • 著者名/発表者名
      岩崎敦
    • 学会等名
      日本オペレーションズ・リサーチ学会2021年春季研究シンポジウム
    • 関連する報告書
      2020 実施状況報告書
    • 招待講演
  • [学会発表] 私的観測下の繰り返し囚人のジレンマにおける協力のダイナミクス2020

    • 著者名/発表者名
      西野上和真
    • 学会等名
      FIT2020第19回情報科学技術フォーラム
    • 関連する報告書
      2020 実施状況報告書
  • [備考] Computational Incentive Science

    • URL

      https://sites.google.com/site/a2ciwasaki/

    • 関連する報告書
      2022 実績報告書 2021 実施状況報告書 2020 実施状況報告書

URL: 

公開日: 2020-08-03   更新日: 2024-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi