Sparse contingency table analysis and its application
Project/Area Number |
20K03756
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 12040:Applied mathematics and statistics-related
|
Research Institution | Tokyo University of Science |
Principal Investigator |
田畑 耕治 東京理科大学, 理工学部情報科学科, 教授 (30453814)
|
Co-Investigator(Kenkyū-buntansha) |
中川 智之 東京理科大学, 理工学部情報科学科, 嘱託特別講師 (70822526)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2024: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2023: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2022: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2021: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2020: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
|
Keywords | 分割表 / 尺度 / 対称性 / 漸近理論 / 欠測データ / 非対称性 / 統計的検定 / 統計的推定 / 分割表解析 / 高次元漸近理論 / 適合度検定 / スパース分割表 / 漸近展開 |
Outline of Research at the Start |
欠測に関する情報を含んだ多元分割表に対して、既存のモデルを用いた解析を行う場合には、二つの大きな問題が存在する。一つ目は、適合度検定統計量のカイ二乗分布への近似がよくないことである。したがって、その数理的な精度評価が必要である。二つ目は、欠測データを含んでいるためその影響を考慮する必要がある。したがって、欠測のメカニズムを考慮した解析方法の開発が必要である。これらの問題については、まだ未解決な部分が多いため、「対称性に関する漸近展開や高次元漸近論を用いたスパース分割表解析」と「無視できない欠測における分割表解析」の2点にフォーカスし、それぞれの問題解決を目指す。
|
Outline of Annual Research Achievements |
・正方分割表の解析において、対称性からの尺度がいくつか提案されている。これらの尺度は、部分尺度の重み付きの和として表現されている。我々は、この部分尺度に注目し、これまでよりも詳細な解析が可能となる尺度の提案を行なった。この他にも、独立性からの逸脱を測る尺度、対称性からの逸脱の方向性を考慮した尺度、条件付き部分対称性からの隔たりを測る尺度、局所周辺同等性からの隔たりを測る尺度について研究した。 ・順序カテゴリ正方分割表の解析において、種々の対称性・非対称性のモデルに対する情報理論的性質について研究し、レビュー論文にまとめた。また、新しい連関モデルを提案し、その性質を論文にまとめた。これらの結果は、これまでの先行研究を含む意味での一般化となっている。 ・2022年度も引き続き、標本数とともにセル数も大きくなる漸近論(高次元漸近論)を用いた適合度検定について研究を行った。特に、正方分割表解析における対称性の検定問題に対して、高次元漸近理論の下での検定統計量の漸近分布の導出について研究を行った。離散項の評価が一番の課題となっており、これについてはさらなる調査・検証が必要と考えられるため2023年度も引き続き検討する。 ・2022年度も引き続き、無視できない欠測を含む2x2分割表に関する研究を行なった。これまでの研究成果をまとめプレプリントをarXivに掲載した。現在は、欠測メカニズムごとに開発された各種方法論との比較、さらなるシミュレーションシナリオの追加を行っている。さらに、ベイズ統計学的手法を取り入れた方法についても現在検討中である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
・2022年度も、正方分割表解析における対称性の検定問題に対して、高次元漸近理論の下での検定統計量の漸近分布の導出について研究を行った。また、高次元漸近理論を用いない方法として、ベイズ統計学の応用、計算代数統計の応用などの本研究に関連する文献調査に関して大学院生や他大学の研究者も含めたゼミを行い、多くの議論を行った。しかし、離散項の評価に関する問題点や課題、計算機を用いた場合の計算コストの問題の解決には至っておらず、それらを解決するために2023年度も引き続き検討を行うこととした。 ・2022年度は、無視できない欠測を含む2×2分割表に関する対称性の検定について、プレプリントを公開した。その一方で、別のアプローチも提案し、その数理的性質の解明、提案手法の性能評価を行い論文としてまとめている。今後も引き続き、ベイズ統計学的手法の適用、先行研究の拡張など様々な角度から検討を続ける予定である。 ・上記の他にも、対称性の検定に関するφ-divergence型統計量の高次のオーダーの導出、φ-divergence型統計量の離散項のオーダー評価、欠測を含んだr×r分割表の対称性の検定、欠測を含む分割表に関するベイズアプローチについて、文献調査結果の報告や意見交換を継続実施した。これらの課題について、いくつかの研究成果が得られつつあるので、2023年度は論文としてまとめる方向でさらなる研究を実施したいと考えている。また、その過程で得られた結果、アイデアについても論文としてまとめていく予定である。
|
Strategy for Future Research Activity |
2022年度の研究体制を継続する。申請者は、欠測を含んだr×r分割表の対称性の検定、欠測を含む分割表に関するベイズアプローチについて、方法論の検討、計算機への実装、実データ解析を主に担当する。欠測を含んだ2×2分割表の方法をr×r分割表へ拡張するためには、識別性の担保が不可欠である。この問題の解決を目指して研究を継続する。研究分担者は、対称性の検定に関するφ-divergence型統計量の高次のオーダーの導出、φ-divergence型統計量の離散項のオーダー評価、対称性の検定に関する高次元分割表解析について、オーダー評価、離散項の導出、数学的な性質の導出を主に担当する。離散項の導出がボトルネックであるとの報告を受けていることから、国内外の研究者と議論することで、問題解決の糸口を継続して探す方向で進める。所属が変更になったが客員准教授として本学に定期的に来てもらい、意見交換や進捗報告を行いながら、2022年度同様に研究を推進する。また、双方のテーマを融合した研究課題も考えられることから、テーマの進捗状況に応じて柔軟に解決すべき問題を選択する予定である。 研究が上手く進まない場合には、zoomミーティングなどを活用して、外部の研究者などと意見交換をする予定である。また、国内外の学会やシンポジウムに参加し、最新の研究動向をチェックすると共に、外部の研究者とのネットワークの拡張、情報交換を積極的に行う予定である。さらに、研究室に多くの大学院生が所属していることから、大学院ゼミなどでも問題意識を共有し、意見交換をする予定である。
|
Report
(3 results)
Research Products
(34 results)