研究課題/領域番号 |
21K11780
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 東京大学 |
研究代表者 |
今泉 允聡 東京大学, 大学院総合文化研究科, 准教授 (90814088)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2021年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | 高次元統計 / 深層学習 / ニューラルネットワーク / 比例的高次元 / 統計的推論 / 統計学 / 深層モデル / 過剰パラメータ / 汎化誤差 / ガウス近似 |
研究開始時の研究の概要 |
近年強い注目を浴びるデータ解析法である深層学習は、物理法則や分子構造の探索や再現といったサイエンスの領域での使用も盛んである。しかし、仮説検定や信頼解析などの統計的推論法を深層学習に用いることは難しく、科学的仮説の厳密な検証法は十分には進展していない。これは、深層・大規模モデルでは適切な極限分布が使えないなど、複数の統計学的障害に由来する。本研究では、高次元ガウス近似などの非漸近な分布近似法を用いることでその障害を克服し、深層学習に適用可能な統計的推論の基盤を構築する。深層学習を用いた科学的仮説の検証・確定を可能にし、深層・大規模モデルによる統計的推論という新しい領域を開拓する。
|
研究成果の概要 |
本研究計画では、現代的な大自由度統計モデルの理解と活用に向けて、高次元モデルにおける統計的推定および推測の理論および手法を開発した。具体的には、パラメータにスパース性を課さない状況における高次元設定のうち、データとパラメータ数が比例関係を持ったまま発散する比例的高次元スキームににおける推定と推論の理論を作った。より具体的には、(i)ノイズが独立性を持たない線形回帰モデルにおける推定誤差のレート評価、(ii)非線形要素を持つ高次元シングルインデックスモデルにおけるバイアス補正法および統計的推論法の開発、(iii)高次元データのスペクトル構造を用いたベイズ推定法の開発、などを推進した。
|
研究成果の学術的意義や社会的意義 |
本研究は、現在発展の著しい深層学習や人工知能といった大規模統計モデルに対して、それらの性質や活用法を明らかにするという基礎研究の性質を持っている。これらの大規模統計モデルは高い性能を発揮してはいるが、内部がブラックボックスであったり計算コストが大きいなどの欠点も多く持っており、これらの原理を理解して効率的・安定的に運用する技術は社会に強く求められている。本研究が発展することで、大規模統計モデルの誤差を正しく補正して性能を上げたり、その予測の不安定性を評価した厳密な検定法を作ったり、学習のパラメータの選択を効率化して計算コストを下げるといった多くの実用的技術の開発が可能になる。
|