統計的ダイバージェンスに基づくモデル評価規準の開発と規準に対する評価
Project/Area Number |
20K19753
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 60030:Statistical science-related
|
Research Institution | Kyushu University (2022-2023) The University of Tokyo (2020-2021) |
Principal Investigator |
倉田 澄人 九州大学, マス・フォア・インダストリ研究所, 助教 (10847122)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Project Status |
Completed (Fiscal Year 2023)
|
Budget Amount *help |
¥3,120,000 (Direct Cost: ¥2,400,000、Indirect Cost: ¥720,000)
Fiscal Year 2023: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2022: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2021: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2020: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
|
Keywords | モデル選択 / 統計学的ダイバージェンス / ロバストネス / 正則化法 / 漸近理論 / スパースモデリング / ベイズ統計学 / 地震学 / 食品科学 |
Outline of Research at the Start |
例えば突出した能力を持った被験者だったり、例えば個性的な回答であったり、例えば観測機器の一時的な故障であったり、或いは人的ミスであったり―現実世界のデータには、様々な由来を持った「外れ値」が付き纏う。 「外れ値」には明確な定義を与え難く、またその発生を防ぐことは事実上不可能であり、これに対する頑健性を明確化することも容易ではない。本研究では、外れ値が混入していたとしても頑健な解析を為せるような手法について、特に統計的ダイバージェンスに基づいたモデル選択を中心に検討する。 加えて、頑健性を筆頭とした「規準の良さ」についての考察を行い、多様な場面、設定下で、「評価規準を評価する為の規準」を構築する。
|
Outline of Annual Research Achievements |
「数理」「データサイエンス」「AI」に対して、現在嘗てない程に需要があらゆる分野から高まっている。その期待に応える為、統計学的モデルは非常に多様化している。多種多様なデータから結論を適切に導く為には、各々の問題に即した分析法が必要であるが、そこで置かれる前提は時に、従来の統計手法が置いている仮定から逸脱してしまう。本研究に於いて中心的に検討しているのは「外れ値」、他のデータから大きく離れた値を持つ、モデルから見た想定外の存在の扱いである。定義や線引きが曖昧な外れ値を適切に処理し、外れ値の有無に依らない「頑健」な分析を為すことは極めて重要である。 本研究では、外れ値に対し頑健な分析法を、特に統計学的ダイバージェンスに基づくモデル評価規準に焦点を当てて理論的に究明している。従来の規準の多くは外れ値に適切に対応する性質を有さず、観測の中に一つでも極端な外れ値があると、外れ値がない場合には有り得ない様な選択をしてしまう場面が多い。本研究成果の主な一つである、情報量規準BICをダイバージェンスに沿って拡張した規準DBBCは、BHHJ divergence等の適切なダイバージェンス族を用いると、極端な外れ値にも耐える選択規準と為ることが本研究の中で示された。 また、本年度は特に、回帰分析に於けるスパース正則化に対して、正則化パラメータの決定に資する頑健な規準の開発に注力した。推定対象が膨大な数になることが多いスパースモデリングは近年盛んに研究・応用されているが、モデル選択に於いては仮定に合わない従来手法や頑健性の乏しい規準が未だ多く使われている現状がある。本研究では、LASSOやSCAD等のスパース正則化が持つ推定の優れた漸近性質を保ったまま、頑健に変数選択を実行可能な正則化項及び選択規準を提案した。
|
Report
(4 results)
Research Products
(20 results)