2022 Fiscal Year Annual Research Report
大規模データ推論のための最大射影型ワッサースタイン理論の開発
Project/Area Number |
22J21512
|
Allocation Type | Single-year Grants |
Research Institution | The University of Tokyo |
Principal Investigator |
岡野 遼 東京大学, 総合文化研究科, 特別研究員(DC1)
|
Project Period (FY) |
2022-04-22 – 2025-03-31
|
Keywords | 統計学 / 確率分布間の距離尺度 / 最適輸送距離 / 二標本検定 |
Outline of Annual Research Achievements |
本年度はまず、分布の低次元射影というテクニックを用いて、ワッサースタイン距離の改良版を提案した。これまでにも分布の低次元射影を用いた距離は提案されていたが、私が提案した距離はそれらを特別な場合として含むかなり一般的なものであり、従来よりも多様な構造の確率分布に対して適用が可能である。また、提案距離は計算時間の点において優れていることがシミュレーションで確認できた。次に、提案した距離尺度に対して、統計的推測の方法を提案した。具体的には、まず真の確率分布が有限集合でサポートされている場合に、提案距離の推定量がどのような分布に漸近的に従うかを理論的に示した。また、ブートストラップ法による漸近分布の分位点の適切な計算方法も提案した。これにより、提案距離を用いた二標本検定を行うことや、データに基づいて提案距離の信頼区間を構成することが可能になった。以上の成果は論文にまとめられ、統計学の国際学術誌であるStatistica Sinicaに採択された。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
分布の低次元射影に基づくワッサースタイン距離の改良版に対して、統計的推測を考察した論文については、統計学の国際学術誌である、Statistica Sinicaに採択された。査読や改訂要求への対応に時間がかかると思われたが、実際には年度内に採択までもっていくことができ、当初の計画以上に進展していると言える。
|
Strategy for Future Research Activity |
今年度得られた成果を実データ解析へ応用することを考えている。特に自分が扱っている分布の低次元射影に基づくタイプのワッサースタイン距離は、データ数が大きい場合やデータの次元が大きい際に有用であり、そのようなデータセットに対する応用を考えている。また、近年ワッサースタイン距離を用いて確率分布値のデータを解析することが注目されており、そのような問題に対して応用することも考えている。
|