研究課題/領域番号 |
19K11853
|
研究機関 | 東京大学 |
研究代表者 |
倉田 博史 東京大学, 大学院総合文化研究科, 教授 (50284237)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | 不均一分散モデル / マハラノビス距離 / 分散構造 / 外れ値 |
研究実績の概要 |
本研究では回帰診断の枠組みを整備し拡張することによって、経時データに有効な診断の理論的基礎と具体的な診断手法の提案を行いたいと考える。1年目にあたる19年度は、説明変数の空間における外れ値の検出のための理論的基礎を考察することを通して、より効率的でかつ現存のロバスト統計学とも整合的な回帰診断の手法を得ることを狙って進めた。説明変数の空間において平均値からマハラノビス距離の意味で離れた観測値は推定値に大きな影響を与え得る。このことは、誤差項の分散共分散行列が単位行列の定数倍である場合 については詳しく調べられているが、分散共分散行列がより一般の構造を持つ場合については余り多くは知られていない。そこで、19年度は、最も単純な場合として、2時点において分散が未知でかつ不均一であるような経時データのモデルを考え、分散の推定値を代入して得られるランダムなマハラノビス距離に基づく説明変数の外れ度の評価について考察した。 2年目である20年度は、上記の評価の問題を、分散の推定誤差の影響を如何に取り除くかという観点から継続し、加えて、誤差項の空間における外れ値の検出のための理論的基礎の問題についても考察を始めた。外れ値は誤差項の空間において発生する場合もあり、これは通常スチューデント化残差によって評価される。しかし、経時データの場合、誤差項の分散共分散行列により一般の構造を仮定する必要があるため、本研究では、それらの研究を経時データの回帰診断の文脈で整理・拡張すべく、まず通常の推定方法と結果的に一致するような分散構造の範囲の導出問題について考察するところから始めている。 関連する研究としてSUR(seemingly unrelated regression)モデルにおける推定問題や距離行列の性質に関する結果も得ている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
研究を始めて痛感した問題として、回帰診断の研究は90年代以降のロバスト統計学の枠組みの急速な発展に吸収された感があり、近年の先行研究が少なく、かなり基礎的な段階から自分で積み重ねなければならない点である。そのため大変に時間がかかる。 加えて、20年度はコロナ禍により、海外の研究者との連携や大学における資料収集、数値計算補助の雇用が軒並み困難となったことやオンライン講義や会議のための準備などに例年以上に時間がかかったことがも大きい。
|
今後の研究の推進方策 |
以下の各点について結果を得たいと考えている。 (1) 誤差項の空間における外れ値の検出のための理論的基礎:外れ値は誤差項の空間において発生する場合もあり、これは通常スチューデント化残差によって評価される。しかし、経時データの場合、誤差項の分散共分散行列によ り一般の構造を仮定する必要があるため、スチューデント化残差の数学的性質はより複雑なものとなり得る。スチューデント化残差の分布は多変量対称分布の研究の一環として幾つか結果が得られており、本研究では、それらの研究を経時データの回帰診断の文脈で整理・拡張することを目指す。特に、時点情報も利用したカットオフポイントとしてより効率的なものを導出するこ とを狙う。そしてそれらを利用して、Cookの距離やDFFITS統計量などの改良を行いたいと考えている。 (2) 経時的均一分散性の検定あるいは診断の問題:経時データにおいては、時点間や個体間で分散が異なると考えられる場合が多い。これらのモデルにおける各種の回帰診断 統計量の構造を明らかにし、既存の分散均一性の検定統計量との関係を調べてゆくことから始める予定である。
|
次年度使用額が生じた理由 |
交付申請の段階では、20年度に2回の海外出張と複数回の国内出張を見込んでいたが、コロナ禍により、海外出張は全て中止にせざるを得ず、また、国内で開催された学会も全てオンラインで行われたため、予定していた旅費を使用せずに終わったことが大きい。また、数値計算なども計画を縮小して自分で行うことが殆どであり、謝金の使用がなかった。これらにより次年度使用額が生じた。
使用計画としては、オンラインでの研究環境の整備が不十分であるため、より高スペックなPCの購入や計算環境の整備に充てたいと考えている。
|