エビデンスに基づいた政策形成における、バンディット問題の応用

Research Project

Project/Area Number	19J20984
Research Category	Grant-in-Aid for JSPS Fellows
Allocation Type	Single-year Grants
Section	国内
Review Section	Basic Section 07030:Economic statistics-related
Research Institution	Kyoto University
Principal Investigator	木戸大道京都大学, 経済学研究科, 特別研究員(DC1)
Project Period (FY)	2019-04-25 – 2022-03-31
Project Status	Completed (Fiscal Year 2021)
Budget Amount *help	¥1,600,000 (Direct Cost: ¥1,600,000) Fiscal Year 2021: ¥500,000 (Direct Cost: ¥500,000) Fiscal Year 2020: ¥500,000 (Direct Cost: ¥500,000) Fiscal Year 2019: ¥600,000 (Direct Cost: ¥600,000)
Keywords	政策学習 / 外的妥当性 / 因果推論 / バンディット問題 / EBPM
Outline of Research at the Start	本研究では，エビデンスに基づいた政策形成（以下，「EBPM」という）におけるバンディット問題の応用について考察する．バンディット問題は，データを集める段階と，そのデータを利用する段階のトレードオフを具体的に考慮する．これは従来のEBPMに関する文脈では考えられてこなかった点である．したがって，バンディット問題をEBPMの枠組みで考察することで，新たな知見を得られる可能性がある．しかしながら，実際のEBPMで起こりうる状況は複雑であり，既存のアルゴリズムがそのまま適用可能なわけではない．ゆえに，実際のEBPMで起こりうる制約を考慮した上で，最適なアルゴリズムを導出することを目標とする．
Outline of Annual Research Achievements	本年度は政策学習の文脈において，利用可能な実験データを生成する母集団（以下，この母集団のことを「ソース母集団」という）が政策を適用したい母集団（以下，この母集団のことを「ターゲット母集団」という）とは異なる場合に，何を目標にどのように政策を学習すればよいかについて研究を行った．この問題は因果推論の文脈においては外的妥当性の問題として認知されており，追加的な強い仮定なしにはターゲット母集団の平均介入効果を識別・推定できないことが知られている．政策学習においても同様の問題が生じ，ターゲット母集団の平均厚生を最大化する最適な政策を識別・推定することができない．そこで本年度の研究では，「Distributionally Robust Optimization」のアイデアを援用し，ソース母集団とターゲット母集団が分布間の距離の意味で一定程度近くに存在するという仮定の下，最悪の場合の平均厚生を最大化するという手法を提案した．これは，ターゲット母集団において最適な政策を求めるというゴールを動かすことを意味する．この修正により，従来の研究で課されてきた追加的な仮定を置かずに意味のある政策を学習することが可能となる．本研究では，このような政策の推定手法を提案するとともに，その理論的性質を導出した．また，職業訓練プログラムに関する実験データを用いて，この手法が実証的にも有用であることを示した．
Research Progress Status	令和3年度が最終年度であるため、記入しない。
Strategy for Future Research Activity	令和3年度が最終年度であるため、記入しない。

Report

(3 results)

Research Products
(2 results)

All 2022

All Presentation (2 results) (of which Int'l Joint Research: 2 results)

[Presentation] Distributionally Robust Policy Learning with Wasserstein Distance2022
- Author(s)
  Daido Kido
- Organizer
  IAAE 2022 Annual Conference
- Related Report
  2021 Annual Research Report
- Int'l Joint Research
[Presentation] Distributionally Robust Policy Learning with Wasserstein Distance2022
- Author(s)
  Daido Kido
- Organizer
  Asian Meeting of the Econometric Society in China 2022
- Related Report
  2021 Annual Research Report
- Int'l Joint Research

エビデンスに基づいた政策形成における、バンディット問題の応用

Principal Investigator

木戸 大道 京都大学, 経済学研究科, 特別研究員(DC1)

¥1,600,000 (Direct Cost: ¥1,600,000)

Report

Research Products

[Presentation] Distributionally Robust Policy Learning with Wasserstein Distance2022

Author(s)

Organizer

Related Report

[Presentation] Distributionally Robust Policy Learning with Wasserstein Distance2022

Author(s)

Organizer

Related Report

木戸大道京都大学, 経済学研究科, 特別研究員(DC1)