研究課題/領域番号 |
26540010
|
研究機関 | 筑波大学 |
研究代表者 |
青嶋 誠 筑波大学, 数理物質系, 教授 (90246679)
|
研究分担者 |
矢田 和善 筑波大学, 数理物質系, 助教 (90585803)
赤平 昌文 筑波大学, 名誉教授 (70017424)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | ビッグデータ / 潜在構造分析 / 異常値 / 欠損値 / 非正則推定論 |
研究実績の概要 |
ビッグデータは、大規模・多様性・高頻度の特性をもつ。これらの特性ゆえに、ビッグデータの解析には、従来の統計学では対処できない様々な問題が発生する。研究課題の初年度に当たる平成26年度は、多様性をもつ大規模データの非正則推定論の開拓に取り組んだ。研究の鍵となるのは、IIDの枠組みを外し、また、確率過程の枠組みも外し、膨張するデータ空間の漸近理論を如何に構築するかである。青嶋と矢田は、赤平と意見交換を行うことで、青嶋と矢田が一連の共同研究で構築してきた高次元小標本漸近理論を双対空間で展開するというアイディアに至った。高次元小標本漸近理論は、たった一つの高次元データでも成立するので、これを膨張するデータ空間に対応させて漸近理論を展開することを考えた。高次元データの非スパース性が長期記憶に対応するため、従属データを扱う時系列解析に、双対空間から新たなアプローチが開拓できる。その際に、データの潜在空間を覆う巨大なノイズ空間の漸近的な挙動を解析的にどう捉えるかが問題になる。ここでは、データ空間の幾何学的表現によって漸近的な挙動を捉えるというアイディアを思いつき、幾何学的表現を得るための数学的な条件を導き出した。その結果、ビッグデータの実用的な観点から比較的緩い条件のもとで、多様性をもつ大規模データの潜在空間を浮き彫りにできることが分かった。 得られた結果は、論文に纏められ、現在投稿中である。また、成果の一部分について、京都大学数理解析研究所RIMS研究集会で発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
交付申請書に記載した研究の目的に沿って、意見交換は密に行われ、新しいアイディアが試されている。ビッグデータの統計理論の開拓は、世界に先駆けた研究であるが、その第一歩となる成果が生まれつつある。それゆえ、おおむね順調に進展していると評価できる。
|
今後の研究の推進方策 |
高次元小標本漸近理論を次元数と標本数の双対空間で展開するというアイディアは、従属データの扱いに、古典的な時系列解析とは双対する全く新しいアプローチを与えるものであり、掘り下げる価値がある。次年度も本研究を継続し、多様性をもつビッグデータの潜在構造分析を開拓する。
|