Project/Area Number |
21H04890
|
Research Category |
Grant-in-Aid for Scientific Research (A)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Medium-sized Section 61:Human informatics and related fields
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
岩崎 敦 電気通信大学, 大学院情報理工学研究科, 准教授 (30380679)
|
Co-Investigator(Kenkyū-buntansha) |
野田 俊也 東京大学, 大学院経済学研究科(経済学部), 講師 (70934727)
|
Project Period (FY) |
2021-04-05 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥27,040,000 (Direct Cost: ¥20,800,000、Indirect Cost: ¥6,240,000)
Fiscal Year 2024: ¥6,890,000 (Direct Cost: ¥5,300,000、Indirect Cost: ¥1,590,000)
Fiscal Year 2023: ¥6,890,000 (Direct Cost: ¥5,300,000、Indirect Cost: ¥1,590,000)
Fiscal Year 2022: ¥6,890,000 (Direct Cost: ¥5,300,000、Indirect Cost: ¥1,590,000)
Fiscal Year 2021: ¥6,370,000 (Direct Cost: ¥4,900,000、Indirect Cost: ¥1,470,000)
|
Keywords | メカニズム設計 / ゲーム理論 / 計量経済学 / アルゴリズム / 最適化 |
Outline of Research at the Start |
本研究では,制約付きマッチングや警備計画策定といった相異なる利害をもつ主体のインセンティブを調整しながら稀少なリソースを配分する仕組み(メカニズム)を実際のデータから評価・修正する,データ駆動型インセンティブ工学を構築する.従来の理論は定性的な分析から,現実の制度や慣習における課題を解決してきた.しかし,研究者が企業や政府の担当者を説得して新しいメカニズムを実践するには,その効果を定量的に示す方が望ましい.そこで最適化や学習のアルゴリズム技法を駆使し,データ駆動で新しいメカニズムを事前に評価する技術の理論的基盤を構築する.
|
Outline of Annual Research Achievements |
本研究では,制約付きマッチングや警備計画策定といった相異なる利害をもつ主体のインセンティブを調整しながら稀少なリソースを配分する仕組み(メカニズム)を実際のデータから評価・修正する,データ駆動型インセンティブ工学を構築する.令和5年度は以下の3 つの項目を相互にフィードバックさせながら研究を推進した:項目1)不確実な環境下における動学ゲームの均衡計算アルゴリズム;項目2)制約付きマッチングの定量的分析;項目3)警備計画策定問題の定量的分析.ただし,項目3については,当初の想定通りにデータが入手できなかったため、花き市場の定量分析に切り替えた。
関連する研究成果は人工知能と統計のトップ会議であるAISTATSに2023および2024に連続して採択された。さらに、AISTATS2023に採択された均衡計算アルゴリズムの発展版が機械学習分野のトップ会議であるICML2024に採択された。また、情報処理学会論文誌にも1編採択された。国内学会の発表は12件あり、今後の国際会議や論文誌への投稿を準備している。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
項目1の均衡計算アルゴリズムについては,昨年の成果をもとに、ノイズを含みうる(利得の)勾配情報の下で、N人単調ゲームにおける終極反復収束(近似でない均衡に有限回で収束, last-iterate convergence)のレートを導出した。これは昨年の成果の一般化であるだけでなく、多数の学習アルゴリムを特殊ケースを含む形でアルゴリズムの枠組みを提案している。具体的には、観察される利得関数を摂動させて均衡の近傍(近似均衡)に収束させやすくする摂動型アルゴリズムのクラスを提案した。この成果は人工知能、とくに機械学習分野のトップ会議であるICML2024に採択された。
項目2の制約付きマッチングについては,昨年度に提案した枠組みを用いて、実際のデータと突き合せた検証を進めた。これには、日本の研修医配属で、どの研修医がどの病院とマッチしたのかだけでなく、研修医や病院の属性(研修医の出身大学や研修先となる病院の給与や労働環境)を収集するのが大きな課題となっていた。そこで厚生労働省の情報公開制度や、研修先情報サイト(レジナビWeb)を運営するメディカルプリンシプル社との連携を通じて、実証に必要なデータの収集に成功した。現在このデータを用いた分析を進めている。この成果は日本経済学会2024年度春季大会で発表予定である。
項目3については、予定していた警備計画策定問題のデータを入手できなくなった。一方で、中古車や花きといった商材のオークション市場を運営するオークネット社と連携し、中古自動車の査定価格予測システムの改善や花き市場の取引データの可視化に取り組んだ。とくに花き市場においてリンギクの取引量や価格にコロナ禍が与えた影響を可視化することに成功した。その成果は情報処理学会全国大会で発表し、2024年人工知能学会全国大会で発表予定である。
|
Strategy for Future Research Activity |
項目1については,引き続きノイズを含みうる(利得の)勾配情報の下で、N人単調ゲームにおける終極反復収束を実現するアルゴリズムの設計・解析を継続する。とくに今のアルゴリズムは、異なるクラスのアルゴリズム、例えばOptimistic Mirror Descentなど、より収束レートが遅いことがわかっている。そこで我々が提案する摂動型アルゴリズムで同等の収束レートを実現する方法がないかを探索する。また、これまでの成果は標準型ゲームに限定していたので、展開型ゲームやシュタッケルベルグゲームにおける摂動型アルゴリズムの開発を進める。
項目2については、入手したデータの分析に努める。具体的には、研修医と病院の効用を推定したうえで、現行の制度が実現している社会厚生を導いた上で、政府が病院に罰金や補助金を課した場合の反実仮想分析を進める。さらに、よりよい制度設計のためには、どのようにデータを収集、整備すればよいかを厚生労働省や医師臨床研修マッチング協議会などの関連団体に提言していきたい。
項目3については、可視化取引データをもとに花きの需要と供給を推定、予測する技術を開発する。項目2で扱った離散選択モデルにもとづく効用推定を基本とする。時期ごとの需要(価格と取引量の関係)を示すことで、花きの供給量が変わったときの反実仮想分析を進めたい。さらにデータの可視化と分析で得た情報をどのような形で生産者に提供するのが適切なのかを議論する。とくに、単純に花き生産者の収入を最大化するだけでは不十分で、花きの生産、流通、消費に関わるステークホルダーからなる社会にとってどのような状態が望ましいか検討する。
|