研究課題/領域番号 |
22K17857
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分60020:数理情報学関連
|
研究機関 | 国立情報学研究所 |
研究代表者 |
藤井 海斗 国立情報学研究所, 情報学プリンシプル研究系, 助教 (50884243)
|
研究期間 (年度) |
2022-04-01 – 2027-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2026年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2025年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2024年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2023年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2022年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
|
キーワード | オンライン学習 / 相関均衡 / メカニズムデザイン / ベイジアンゲーム / 組合せ最適化 / 機械学習 |
研究開始時の研究の概要 |
本研究課題では、近似アルゴリズムの理論を用いて、組合せ最適化問題に対する実用的なアルゴリズムが近似保証をもつための条件を明らかにする。特に、近似アルゴリズムを設計しやすい問題に共通する性質である劣モジュラ性に着目し、解きたい問題の性質が劣モジュラ性にどれくらい近いかを測ることで、実用的なアルゴリズムに近似保証を与える。これによって、現実の問題に対するアルゴリズムの設計に寄与することを目指す。
|
研究実績の概要 |
初年度は、近似的劣モジュラ性と深い繋がりをもつ、ゲームのsmoothnessについて研究した。ゲームのsmoothnessとは、任意の実行可能解において、各プレイヤーの逸脱が最適値との距離を十分に縮めるという性質である。この性質は、ある一定の条件下において、局所探索のための近似的劣モジュラ性(localizability)と等価である。 本研究では、情報がプレイヤー間で共有されていないゲーム(ベイジアンゲーム)において、smoothnessが満たされていれば、ある種のダイナミクスの収束先が近似的に最適であることを示した。このダイナミクスは、同じゲームを何度も繰り返す中で、各プレイヤーがオンライン学習のアルゴリズムに従って戦略を更新することで得られる。各プレイヤーがuntruthful swap regretと呼ばれる量を最小化すれば、このダイナミクスはコミュニケーション均衡(coordination mechanismとも呼ばれる)へと収束することを示した。untruthful swap regretを劣線形に抑える効率的なアルゴリズムを提案し、このアルゴリズムによって達成されるオーダーがそれ以上改善できないことも証明した。収束先のprice of anarchyがsmoothnessによって抑えられることから、このダイナミクスをシミュレートすることで、近似的に最適な均衡が計算できることが示唆される。この技術は、例えば既存のメカニズムから近似的に最適なメカニズムを導出するのに利用できると期待される。 また、劣モジュラ最適化に関する書籍(相馬輔氏、宮内敦史氏との共著)を出版した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
当初は予想していなかったゲーム理論との繋がりが発見されたため。
|
今後の研究の推進方策 |
初年度に得られた成果のさらなる発展を目指すとともに、他分野への応用を模索する。
|