研究課題/領域番号 |
17500180
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
統計科学
|
研究機関 | 岐阜大学 |
研究代表者 |
寒河江 雅彦 岐阜大学, 工学部, 准教授 (20215669)
|
研究分担者 |
小暮 厚之 慶応大学, 総合政策学部, 教授 (80178251)
|
研究期間 (年度) |
2005 – 2007
|
研究課題ステータス |
完了 (2007年度)
|
配分額 *注記 |
2,930千円 (直接経費: 2,600千円、間接経費: 330千円)
2007年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2006年度: 700千円 (直接経費: 700千円)
2005年度: 800千円 (直接経費: 800千円)
|
キーワード | ノンパラメトリック統計 / データマイニング / データスクワッシング / 局所モーメント法 / カーネル推定 / ノンパラメトリック / カーネル推理 / 確率密度関数 |
研究概要 |
本研究では局所モーメント情報を利用したグループ化データに基づく最尤推定の理論的な枠組みを提供している。実用面では大規模データの大幅なデータ縮約化技法としてカーネルデータスクワッシング法を開発し、密度推定と回帰問題の最尤推定に応用した。 データのグループ化は大規模データの統計解析の簡便法と見られる。それは大規模データの計算量の増加によって生ずる計算コストを大幅に軽減するためである。その一つが近年注目されているデータスクワッシングである。大規模データによる推定精度をあまり落とさずにデータのボリュームを小さくする工夫である。一つの方向はデータをグループ化し、そのグループ情報として局所モーメントを利用することである。その理論的精度はグループ化尤度解析で明らかにした。データスクワッシングのオリジナルな考えは、データ自体を小さなサイズのサンプルに置き換えることである。この概念はDumonchelらによって提案されている。しかしながら、この理論的な性質は解明されておらず、本研究ではこの理論的な解析を行った。 1年目は、データを局所モーメント情報として保存し、最尤法を適用する方法を提案した。推定量の精度の違いを理論的に導き、先行研究の結果を改良していることを示した。 2年目は大規模データの計算量の増加の問題を解決するために統計的データ縮約化法の研究を行った。我々は計算量を大幅に軽減するためにデータをグループにまとめて、その情報として局所モーメント情報を保持することを考えた。データの統計的圧縮に着目し、カーネルデータスクワッシング法を提案し、その理論的な性質を導き、確率密度推定のシュミレーション実験によってその有効性を確認した。 最終年度はカーネルデータスクワッシング法を回帰モデルの最尤推定問題に適用し、1000分の1程度のデータ縮約化しても推定精度はあまり低下しないことを理論的に明らかにし、回帰モデルの推定シュミレーションにおいてその有効性を確認した。 この研究成果は研究発表(平成17-19年度の研究成果)で記載のとおりで11編の研究論文にまとめた。
|