2022 Fiscal Year Annual Research Report
Innovative Developments of Theories and Methodologies for Large Complex Data
Project/Area Number |
20H00576
|
Research Institution | University of Tsukuba |
Principal Investigator |
青嶋 誠 筑波大学, 数理物質系, 教授 (90246679)
|
Co-Investigator(Kenkyū-buntansha) |
矢田 和善 筑波大学, 数理物質系, 准教授 (90585803)
松田 安昌 東北大学, 経済学研究科, 教授 (10301590)
星野 伸明 金沢大学, 経済学経営学系, 教授 (00313627)
田畑 耕治 東京理科大学, 理工学部情報科学科, 教授 (30453814)
片山 翔太 慶應義塾大学, 経済学部(三田), 准教授 (50742459)
鈴木 大慈 東京大学, 大学院情報理工学系研究科, 准教授 (60551372)
中山 優吾 京都大学, 情報学研究科, 助教 (40884169)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Keywords | 高次元データ / 時空間データ / 高次元統計解析 / 深層学習 / 高次元小標本 |
Outline of Annual Research Achievements |
青嶋と矢田は、ノイズ掃き出し法に閾値を設けた正則化PCAを考え、高次元データの潜在構造推定法を開発し、潜在ベクトルの推定と変数選択を同時に処理する高精度な高次元クラスタリングを可能にした。高次元データは3つの階層構造に分類されることを証明した。青嶋と矢田と中山は、汚染データを主成分空間に炙り出す幾何学的方法を開発した。主成分スコアにSmirnov-Grubbs検定を適用し、汚染データを高精度に検出する方法も開発した。星野は、大規模分割表の分布論について、多項分布の母数が正規化無限分解可能分布の部分族に従うとき、混合分布がベル多項式分布となることを明らかにした。ベル多項式分布が漸近的に正規化無限分解可能分布に収束することが分かり、大標本理論の枠組みが完成した。田畑は、分割表解析におけるダイバージェンスに基づく対称性のモデリングについて、対称性が成り立つための必要十分条件を与えた。片山は、未観測交絡変数が存在し得る状況において proximal causal learning を用いた高次元統計的推測の定式化を行い、推定量の性質を調査した。鈴木は、高次元データにおけるニューラルネットワークの学習に関して、標本数と次元を無限に飛ばす比例極限において、特徴学習を行わない手法は線形関数のみを学習し、勾配法によって特徴学習する手法は非線形成分も学習できることを示した。平均場ニューラルネットワークの最適化における離散化誤差や転移学習のスケーリング則も研究した。松田は、コロナ禍における人流と感染者数の関係を分析するために、ドコモ人流データおよびコロナ感染者数を市区町村別に集計し大規模空間データを構成して、時空間回帰モデルを応用した。 得られた研究成果は国内外の学会や学術誌で発表し、さらに、研究テーマに沿ったシンポジウムを筑波大学・慶應義塾大学・東北大学・東京理科大学・金沢大学で開催した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究計画の3年目として、研究目的を達成するための基礎理論が、ほぼ計画通り完成しつつある。特に、 (1)高次元小標本漸近理論の精密化と体系化 (2)汚染データに頑健な非スパースモデリングの構築 については、当初に計画していた以上の成果が見える。
|
Strategy for Future Research Activity |
「現在までの進捗状況」であげた2点に加えて、 (3)高速・頑健・高精度な大規模マルチ・ドメイン学習の構築 (4)高次元統計解析による深層学習の解明 (5)大規模時空間データへの非スパースモデリングの拡張 の3点について重点的に推し進め、研究目的の達成に向けて研究を加速させたい。
|
Research Products
(40 results)