外れ値と正規性に関する多変量統計解析手法の開発と応用
Project/Area Number |
22K17861
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 60030:Statistical science-related
|
Research Institution | Aoyama Gakuin University |
Principal Investigator |
川崎 玉恵 青山学院大学, 経済学部, 准教授 (30778212)
|
Project Period (FY) |
2022-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥3,510,000 (Direct Cost: ¥2,700,000、Indirect Cost: ¥810,000)
Fiscal Year 2025: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2023: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2022: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
|
Keywords | 多変量解析 / 仮説検定 / 統計理論 / 統計科学 / 漸近理論 |
Outline of Research at the Start |
多様なデータが容易に手に入り,利活用が進む近年,データ内に外れ値が含まれていることや,データに正規性を仮定出来ない場合も数多く存在する.先行研究では,提案手法の式が複雑過ぎるものや,仮定が厳しく適応しにくい結果も多かった.そこで本研究では,多変量解析において「データに外れ値が含まれているかどうか」と「データに正規性を仮定出来るかどうか」の仮説検定問題を中心に,データサイエンス・統計科学のさらなる発展を目指す.
|
Outline of Annual Research Achievements |
本研究課題のひとつである外れ値に関する研究については,昨年,問題に設定していた仮説検定問題に対する検定統計量の中に含まれる統計量の漸近展開を行い,その分布の展開を与えていた.今年度はさらに,その統計量の最大値の量として表現されている目的の検定統計量の近似分布を,多重比較法の考えであるボンフェローニの一次近似を用いて導出した.また,モンテカルロ・シミュレーションによる数値比較によって,その近似精度と特長について議論し,国際会議にて発表を行った. また,正規性の検定については,研究対象にしていた標本尖度に関する正規性検定統計量について議論を深めていたところ,その検定統計量が提案されている論文の主となる結果に誤りを見つけた.そこで,その誤っている結果について正しいものを導出する計算を行っている.また,その中で,当初考えていた拡張(母分散共分散行列を未知とするもの)とは別の拡張方法(欠測値に対する適用方法の提案)についても検討することができそうなことがわかり,上記の修正を行えた後,上記問題に取り組むこととしている.ただ,本計算は膨大な計算量が必要となるため,慎重に議論を進めている. また,これらの研究課題のベースとなる研究として取り組んでいた欠測値を含む部分平均ベクトルに関する検定問題については,givenとなる条件付きの仮説部分と2-step単調欠測が生じる部分について3パターンに分け,それぞれについて議論を行い,現在論文投稿中である.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本課題のテーマの一つである外れ値に関する研究については,一つの結果を導き出すことができ,国際学会での発表を行い,有益なコメントもいただけた一方で,論文化に向けてさらにもう一段階踏み込まなければいけないことも分かり,今後はその対応を考えることとする.そのため本年度のうちに論文化には至らなかった. 一方で正規性の研究については,研究対象にしようとしていた検定統計量に関して議論を深めていたところ,その検定統計量が提案されている論文の主となる結果に誤りを見つけたため,まずはその論文を正しく修正し,そのうえで当初考えていた拡張へと進もうとしている.論文の誤りについては想定外の状況であり,また,著者に問い合わせてみたところ,計算過程の資料はもう残っていないということであったため,状況としては遅れてしまっている.一方で,上記の修正には大幅な計算時間が必要となるが,本来目的としていた母分散共分散行列が未知の場合での計算にもつながる演算が多数出てきているため,もう一段階大きな結果となる可能性がある.
|
Strategy for Future Research Activity |
今後はまず,正規性の先行研究の修正を第一に行う予定である.本修正結果は,当初目的としていた研究内容の特別なケースに該当するため,この段階の結果が出るということは,その先の研究結果の検算にも使うことができ,数値例の比較にも用いることが可能となるため,無駄にはならない重要な研究となる. また,外れ値の検出に関する研究については,今回与えた多変量正規母集団の仮定をゆるめることや,ボンフェローニの一次近似を用いて導出していた近似解を修正二次近似を用いて新たな提案を行うなど,さらなる拡張を目指す. また,これらの研究課題のベースとなる欠測値を含むデータに関する仮説検定問題の研究についても,いくつか手元で着手しているものがあり,この結果を基に正規性や外れ値への応用も検討したい.
|
Report
(2 results)
Research Products
(3 results)