2021 Fiscal Year Research-status Report
統計的ダイバージェンスに基づくモデル評価規準の開発と規準に対する評価
Project/Area Number |
20K19753
|
Research Institution | The University of Tokyo |
Principal Investigator |
倉田 澄人 東京大学, 大学院情報理工学系研究科, 特任助教 (10847122)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | モデル選択 / 統計学的ダイバージェンス / ロバストネス / ベイズ統計学 / スパースモデリング / 地震学 / 食品科学 |
Outline of Annual Research Achievements |
AICやBICに代表されるモデル評価規準は数多く存在する。本研究では評価規準の提案に加え、評価規準に対する評価法についても、特に頑健性(外れ値への強さ)に焦点を当て検討している。申請者はこれまで、BHHJ divergence familyに基づいたモデル評価規準を導出し、その性質についての検討を行ってきた。 本年度は、BHHJ divergenceを内包するダイバージェンスとして重要な二つの族、チューニングパラメータを用いて拡張を行ったJHHB divergence familyと、凸関数を用いて拡張したC divergence familyに着目した。これらは母数推定や仮説検定に於いてはBHHJ divergenceの頑健性を継承することが示されているが、これらをモデル選択に応用した際の性質については明らかにされていない。本研究では、データが真の分布とそれとは異なる(謂わば外れ値の元なる)分布との混合分布から発生していると仮定した場合のモデル評価規準の値が、混合の無い真の分布から発生しているときの値とどの程度変わるかという量を評価することにより、規準の頑健性を検討した。結果として、C divergenceに属するダイバージェンスの多く(BHHJは例外)はJHHB divergenceと比較して選択の頑健性に必要となる条件が相対的に厳しくなることが分かり、数値実験でもその頑健性の傾向の違いが確認された。加えて、独立異分布設定(各標本が独立ではあるが同一分布に従っている訳ではない設定)下にて、gamma divergenceに基づいた規準が外れ値に敏感になりがちな傾向を理論面からより精確に示した。 本年度の研究の中で、母数推定に於ける頑健性とモデル選択に応用した際の頑健性は必ずしも同義ではないことが示された。本研究成果は学会発表済であり、また論文投稿を行っている(査読中)。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
申請者がこれまで検討してきたモデル選択に於ける頑健性は、外れ値が現実世界のあらゆる分野に存在する以上、非常に重要な性質である。本年度はBHHJ divergence familyに基づいた頑健なモデル評価規準をより広いダイバージェンス族に拡張した場合の性質を解明した。またその中で、過去に検討していた頑健性評価以上に精密な検討を行うことで、外れ値への強さをより精確に確認するに至った。C divergence familyはカーネル法を用いることでf-divergenceの性質と頑健性を両立出来るが、選択に於ける頑健性はBHHJ divergenceよりも条件が厳しくなり限定的であることが分かった。JHHB divergence familyの一つで推定の頑健性に優れるgamma divergenceは、独立同分布に対しては頑健だが独立異分布設定の場合には頑健な選択が成せないことを示した。これらの検討から、過去に提案したBHHJ divergenceに基づいた評価規準の優越性が確認された。 なお、本年度は地震学に対するスパースモデリングの応用、並びに食品科学に対する一般化線形モデルの導入等の応用研究(何れも論文採択済)を行った。 以上を踏まえ、この自己評価とする。
|
Strategy for Future Research Activity |
本年度の研究により、BHHJ divergenceよりも広いダイバージェンス族に対する、モデル選択に於ける頑健性の検討が進み、選択の頑健性が成立するための条件が示された。 ところで、選択の一致性と外れ値への頑健性を両立するモデル選択規準の作成は実現しているが、モデル選択に於ける有益な性質は他にも考えられる。例えば選択時の有効性や、リスク関数に対する不偏性、高割合の外れ値混入に対する安定性、高次元設定への対応可能性、更には正則化に対する妥当な規準構築等が挙げられる。これらの観点から更なる改良を施すことにより、より汎用性の高い安定した規準を導出出来ると考えている。 なお、各ダイバージェンスが頑健選択を成せる為の条件の中には、BHHJ divergence含む多くのダイバージェンスが抱える、チューニングパラメータの値に対するものも含まれている。しかしながら、特にBHHJ divergenceの場合、頑健性が成立する範囲は広く、より範囲を絞った提案が望まれる。近年、母数推定に於いてデータに応じた決定手法が提案されており、本研究ではモデル選択に対する検討を予定している。 研究開始当初から規準の提案・考察においては、(ア)導出に於ける理論的正当性、(イ)多様な設定に対する実験による裏付け、(ウ)運用可能な場面の広さの提示、(エ)規準の「良さ」の定式化、を軸としていたが、次年度以降もこれに沿った研究を推進する。
|
Causes of Carryover |
前年度に引き続き、本年度も参加学会の多くがオンライン開催(又はハイブリッド開催)となり、旅費が必要なくなった。その予算の一部を物品費に充てることを図ったが、予定全額をそちらへ投じる必要はなかった為、一部を次年度使用額とした。
|
Research Products
(6 results)