2020 Fiscal Year Research-status Report
セミパラメトリック関数推定に基づく統計解析の新たな展開
Project/Area Number |
19K11851
|
Research Institution | Chiba University |
Principal Investigator |
内藤 貫太 千葉大学, 大学院理学研究院, 教授 (80304252)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 関数推定 / 適合度検定 / ダイバージェンス / カーネル法 / 漸近理論 |
Outline of Annual Research Achievements |
2020年度は交付申請書に記載のサブテーマ「理論的拡張と深化」での実績が得られた。特に、ヒルベルト空間における適合度検定に関する2つの研究成果が得られた。 データがヒルベルト空間に値を取るという設定を考えることで、データの次元に係わらず方法論の構築ができる。特に再生核ヒルベルト空間で方法論を構築することが有効となる。本研究課題の主題である「関数推定」の視点からは、分布に関する仮説検定である適合度検定を、関数空間である再生核ヒルベルト空間において考えることが重要となる。 適合度検定で何よりまず考察されるべき内容は、データの分布が正規分布であるという仮説検定、すなわち正規性の検定である。先行研究で、Maximum Mean Discrepancy (MMD)という分布の隔たりを測る尺度に基づく、再生核ヒルベルト空間における正規性の検定が議論されていた。しかしながら、その漸近的性質、特に、漸近帰無分布、対立仮説のもとでの漸近分布、そして局所対立仮説のもとでの漸近分布は導かれておらず、これらを全て導出したのが1つ目の研究成果となる。検定を行う上で、漸近帰無分布を利用して棄却点が定められるが、漸近分布自体がカイ2乗確率変数の重み付き無限和という利用が困難な形をしているため、その有効な近似に必要な膨大な理論計算を与え、精度の良い近似検定を構築・提案した。 2つ目の成果として、ヒルベルト空間において、正規性の検定に限らずより一般に適合度検定を考える場合、その検定がMMDに基づくものであれば、検定の漸近帰無分布はカイ2乗確率変数の重み付き無限和となってしまい、利用が困難となる。検定統計量をわずかに修正することで、漸近帰無分布が正規分布となる。このような事実はユークリッド空間における適合度検定では示されていたが、この結果をヒルベルト空間に拡張したのが2つ目の成果となる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2020年度においては、ヒルベルト空間における正規性の検定の漸近理論とその有効近似に関する論文が出版された。また、分布間の2乗距離をヒルベルト空間に拡張したMaximum Mean Discrepancyに基づくヒルベルト空間における適合度検定に関し、その漸近帰無分布の有効な修正に関する論文が出版された。 局所ダイバージェンスに基づく回帰分析に関する理論について、統計関連学会連合大会と科研費研究集会にて講演発表した。 ノンパラメトリック回帰分析におけるLASSO型推定量の改良に関する論文、局所ダイバージェンスに基づく回帰分析の理論的性質に関する論文、および罰則付き尤度に基づくサポートベクター回帰に関する論文が投稿された。 このように2020年度では、2本の論文が出版され、3本の論文が投稿された。講演発表も適宜行われており、このような実績を鑑み“おおむね順調に進展している”と判断する。
|
Strategy for Future Research Activity |
交付申請書に記載した計画の大きな変更は特に必要ないと判断し、研究計画に記載した3つのサブテーマの研究を引き続き推進する。しかしながら、サブテーマ「様々な関数推定法の評価」と「理論的拡張と深化」においては、研究分担者を加え、研究の更なる推進を図る。 サブテーマ「様々な関数推定法の評価」においては、核型密度推定に関しての機械学習的アルゴリズムの構築とその精度評価について研究を進める。特に、核型密度推定で必要となるバンド幅(平滑化パラメータ)を辞書として与え、その辞書に基づき逐次最適化アルゴリズムを通して推定量を構築する方法の理論的・数値的振舞いを詳しく調べる。このために、ノンパラメトリック核型推定に詳しい研究分担者を加える。 サブテーマ「理論的拡張と深化」では、高次元空間における適合度検定として特に、楕円分布の検定について研究を推進する。主成分分析のロバストネスに関する研究から派生した研究として、正規化した確率ベクトルの共分散行列に関する数学的結果が存在している。その共分散行列の推定量(行列)の固有ベクトルに基づき、データの分布が楕円分布であるか否かをチェックすることが可能となる。このアイデアを方法として確立し、その理論的・数値的挙動を解明したい。このために、高次元多変量解析に明るい研究分担者を加える。 サブテーマ「新たな応用の開拓」では、2020年度に引き続き、歪曲度に基づく多変量解析手法を開発し、従来手法との比較を行う。 これら3つのサブテーマを俯瞰・統合して、研究課題「セミパラメトリック関数推定に基づく統計解析の新たな展開」の最終年度を総括する。
|
Causes of Carryover |
次年度使用額が生じた理由の1つ目は、2021年1月に豪州にて開催予定であった国際会議が、新型コロナウィルス感染拡大の影響で延期になったためである。2つ目は、研究成果の発表の機会と考えていた国内の学会・研究集会が軒並みオンライン開催となったためである。3つ目は海外の研究者との共同研究が、海外渡航ができないことから中止になったためである。これらの事から、未使用額が生じた理由は、旅費の執行ができなかったことにつきる。 2021年度分助成金と併せての使用計画としては、海外渡航が可能となる状況となればであるが、2022年1月に延期された豪州開催の国際会議へ参加することとなっており、その旅費として利用することになる予定である。2022年3月にも豪州の研究者との共同研究が予定されており、渡航可能な状況であれば旅費の執行がされる予定である。
|