研究課題/領域番号 |
21K11781
|
研究機関 | 東京大学 |
研究代表者 |
清 智也 東京大学, 大学院情報理工学系研究科, 教授 (20401242)
|
研究分担者 |
田中 潮 大阪府立大学, 理学(系)研究科(研究院), 助教 (60516897)
|
研究期間 (年度) |
2021-04-01 – 2026-03-31
|
キーワード | コピュラモデル / グラフィカルモデル / 情報幾何 / 測度集中 / 統計的推測 |
研究実績の概要 |
本研究課題の主軸である最小情報コピュラモデルについて、情報幾何学、一般化線形モデリング、グラフィカルモデリング、測度距離空間との関係性について調査を進めた。結果として、コピュラはこれらの概念と密接に関連することが分かってきた。この点を踏まえ、より多様な多変量データを扱うための統計モデルとして最小情報従属モデルを提案し、推測法を模索した。本モデルの推測法に関して以下の2つの結果を得た。 1つ目は条件付き推測法の確立である。条件付き推測法は古くはフィッシャーらにより分割表の解析に有効な方法として提案され、2000年までの間にかなり詳細に調べられている。本研究で扱っているモデルは条件付き推測法と相性が良いことが分かり、それを実際に数値的に計算できる手続きを明らかにした。ソフトウェアRで標準的に用いられている実データの解析を通して、その有用性を確認した。 2つ目はスコアリングルールを構築である。スコアリングルールとは、統計モデルに含まれるパラメータを推定するための一般的な枠組みである。特に、密度関数に含まれる正規化定数を計算せずに推定するためのアプローチとして局所スコアと呼ばれるものがある。本研究では局所スコアを拡張した多点局所スコアという概念を新たに定義し、最小情報コピュラモデルに含まれる正規化関数を計算せずに推定できるスコアを実際に構成した。本結果はコピュラ理論のみならず、統計的推定理論の発展にも貢献するものと考えられる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
新たに提案した統計モデルは当初予想していたよりもはるかに汎用性があり、また数理的にも扱いやすいことが判明した。今後の発展性が予想され、また社会に与えるインパクトも大きいものと考えられる。
|
今後の研究の推進方策 |
まず、最小情報従属モデルに関して現在執筆中の論文を完成させる。その上で、今後行うべき研究について3つ挙げる。 一つは扱えるデータの範囲を大きくすることである。現状は、観測数が数百程度で変数が数十程度のデータを扱うのが限界である。しかし実装上あるいは理論上の工夫により、より大規模なデータに対しても扱えるようにしたい。どのようにしてスケーラビリティを確保するかを模索する。 2つ目の研究課題はモデルの拡張である。現状は独立同分布性を仮定しているため、時系列データなどには適用できない。この制約を外すことが望まれる。まずは定常なマルコフ過程などを対象に、モデルの拡張を試みる。また因果モデルとしての利用法や欠損データの扱いについて考察したい。 もう一つの課題は、測度集中現象との関係性である。提案モデルは直積空間上の確率分布を定めるが、高次元における分布の性質についてはあまり分かっていない。これまでに得られた測度距離空間上の集中現象の知見をもとに、モデルの性質を調べ上げることが目標である。
|
次年度使用額が生じた理由 |
本年度に得られた研究結果を論文化し、オープンアクセス化するための費用として次年度使用額が生じている。
|