2020 Fiscal Year Research-status Report
統計的ダイバージェンスに基づくモデル評価規準の開発と規準に対する評価
Project/Area Number |
20K19753
|
Research Institution | The University of Tokyo |
Principal Investigator |
倉田 澄人 東京大学, 大学院情報理工学系研究科, 特任助教 (10847122)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | モデル選択 / 統計学的ダイバージェンス / ロバストネス / ベイズ統計学 / スパースモデリング / 地震学 |
Outline of Annual Research Achievements |
モデル選択において、「正しい(データを生成する分布に等しい)」またはそれに最も近いモデルを選択できるということは理想的な性質の一つである。BICは、大標本時にデータを生成する分布に合致するモデルを選択できる性質(選択一致性)を有する代表的なモデル評価規準である。しかし観測値の中に外れ値が混入している場合、選択精度を大きく悪化させてしまう傾向が指摘されている。本研究においては、モデル選択時の頑健性(外れ値の有無による影響を受けにくい特長)に関する検討を行った。 Kurata and Hamada (2020)にて提案したRCCは、頑健性と選択一致性を両立した規準である。RCCはBICを、基盤となるダイバージェンスをBHHJ divergence (Basu et al. (1998))へと拡張した規準族であり、一般化周辺尤度(を変換した形)を近似したものと解釈できる。ベイズ型規準は広範なダイバージェンス族から導くことが可能であり、多くの場合選択一致性を有した規準が定義できる。 これに対し、申請者が過去に提案した規準の頑健性を視る指標GIFC (generalized influence function of criterion)を考慮したところ、ロバスト推定に優れたダイバージェンス(e.g., Jones et al. (2001), Fujisawa and Eguchi (2008))が必ずしも外れ値(を生む本来の生成分布とは異なる分布)が混入した際の変動を一定以下に抑えるとは限らないことが証明された。一般化線形モデルを用いたモデル選択実験においても、選択精度が大きく異なることが確認された。 なお本年度は以上に加えて、モデル評価規準の実データ適用に関しても積極的に行った。また、スパースモデリングの応用にあたって、スパース設定下でのモデル選択規準の応用研究も開始した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究の開始前からの大きな疑問の一つとなっていたのは、(申請者の過去の研究において)提案した規準が示した強い頑健性の由来であった。特に、当時から注目していたBHHJ divergence familyがモデル選択への応用に対して殊に優れた能力を有しているのか、頑健推定に特化したダイバージェンスであれば何でも頑健な推定が可能であるのかという疑問は、本年度の研究によりかなり明らかになった。 また、対評価規準の評価尺度であるGIFCの有用性を、異なるダイバージェンス族に対する評価を行うことで、多様な数値実験との検討も経て確認することが出来た。モデル評価規準に対する評価において、母数選択を頑健に行える(外れ値の有無に対して推定量が影響を受けにくい)ことと、モデル選択が頑健に行える(規準の値、延いては選択結果が変わりにくい)ことの不一致が示されたことは、規準の運用可能な場面の広さの提示を行うにおいて重要な成果であると考えられる。 その一方で、BIC型並びにAIC型の規準導出にあたっては、カーネルを用いた拡張等により、更に幅広い規準の導出可能性があるが、こちらは未着手となった。 また、本研究開始後に新たに課題として浮上した、地震学(地震波速度トモグラフィ)にスパースモデリングを導入した上でモデル選択規準の応用を図ることについては、モデル選択手法を本格的に導入するまでには進捗が至らなかった。 以上を踏まえ、この自己評価とする。
|
Strategy for Future Research Activity |
特定のダイバージェンス族に対する選択の頑健(robust)・非頑健(sensitive)を評価することは、GIFCを用いた研究により可能となった。次年度はこれを更に幅広い族に対して検討し、具体的な選択頑健性の条件を導出することが一つの目標となる。加えて、モデル選択の頑健性や選択一致性と異なる性質との並立可能性についても検討を行い、それと併せて、過去に提案した評価規準BHHJ-C (Kurata and Hamada (2018))やRCCの実データ応用、またそれに伴う改良や拡張可能性も引き続き検討する。 研究開始当初から規準の提案・考察においては、(ア)導出に於ける理論的正当性、(イ)多様な設定に対する実験による裏付け、(ウ)運用可能な場面の広さの提示、(エ)規準の「良さ」の定式化、を軸としていたが、これに沿った研究を推進する。 もう一点、次年度の課題として、地震波速度トモグラフィにスパースモデリングを導入し、それに対する適切なモデル評価規準の利用を行うことが挙げられる。近年LASSOに代表されるスパースモデリングにAIC型の規準が提案されており、多くの成果を上げている(e.g., Ninomiya and Kawano (2016), Umezu et al. (2019))。これらを応用、深化、拡張することで、より優れたモデルや、正則化パラメータの選定に寄与することが、計画当初にはなかった新規の目標となる。
|
Causes of Carryover |
本年度は開催予定だった国内外の学会の多くがオンライン開催、又は中止となり、旅費が必要なくなった。その予算の一部を物品費に充てることを図ったが、予定全額をそちらへ投じる必要はなかった為、次年度使用額とした。
|
Research Products
(6 results)