研究課題/領域番号 |
20H00576
|
研究種目 |
基盤研究(A)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
中区分60:情報科学、情報工学およびその関連分野
|
研究機関 | 筑波大学 |
研究代表者 |
青嶋 誠 筑波大学, 数理物質系, 教授 (90246679)
|
研究分担者 |
矢田 和善 筑波大学, 数理物質系, 教授 (90585803)
星野 伸明 金沢大学, 経済学経営学系, 教授 (00313627)
塩濱 敬之 南山大学, 理工学部, 教授 (40361844)
鈴木 大慈 東京大学, 大学院情報理工学系研究科, 准教授 (60551372)
石井 晶 東京理科大学, 創域理工学部情報計算科学科, 講師 (20801161)
江頭 健斗 東京理科大学, 創域理工学部情報計算科学科, 助教 (20979869)
荒木 由布子 東北大学, 情報科学研究科, 教授 (80403913)
川野 秀一 九州大学, 数理学研究院, 教授 (50611448)
蛭川 潤一 新潟大学, 自然科学系, 准教授 (10386617)
松田 安昌 東北大学, 経済学研究科, 教授 (10301590)
田畑 耕治 東京理科大学, 理工学部情報科学科, 教授 (30453814)
片山 翔太 慶應義塾大学, 経済学部(三田), 准教授 (50742459)
中山 優吾 京都大学, 情報学研究科, 助教 (40884169)
植木 優夫 長崎大学, 情報データ科学部, 教授 (10515860)
小森 理 成蹊大学, 理工学部, 准教授 (60586379)
金森 敬文 東京工業大学, 情報理工学院, 教授 (60334546)
松井 秀俊 滋賀大学, データサイエンス学部, 准教授 (90633305)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
44,460千円 (直接経費: 34,200千円、間接経費: 10,260千円)
2024年度: 9,490千円 (直接経費: 7,300千円、間接経費: 2,190千円)
2023年度: 9,360千円 (直接経費: 7,200千円、間接経費: 2,160千円)
2022年度: 7,410千円 (直接経費: 5,700千円、間接経費: 1,710千円)
2021年度: 8,190千円 (直接経費: 6,300千円、間接経費: 1,890千円)
2020年度: 10,010千円 (直接経費: 7,700千円、間接経費: 2,310千円)
|
キーワード | 高次元データ / 時空間データ / 高次元統計解析 / 深層学習 / 高次元小標本 |
研究開始時の研究の概要 |
本研究は、益々巨大化かつ複雑化する多様な大規模複雑データに、統一的な理論を開拓し、高速で頑健かつ高精度な方法論を開発することで、最先端データ科学に革新的な展開を図る。高次元統計解析を基軸とし、機械学習、深層学習、時空間統計、生物統計、公的統計を世界的レベルでリードしてきた研究者達が本研究課題のもと一堂に会し、連携・融合・発展することで、科学技術・社会・経済・産業の要請に多大な貢献をもたらすことを目指す。
|
研究実績の概要 |
青嶋と矢田は、ノイズ掃き出し法に閾値を設けた正則化PCAを考え、高次元データの潜在構造推定法を開発し、潜在ベクトルの推定と変数選択を同時に処理する高精度な高次元クラスタリングを可能にした。高次元データは3つの階層構造に分類されることを証明した。青嶋と矢田と中山は、汚染データを主成分空間に炙り出す幾何学的方法を開発した。主成分スコアにSmirnov-Grubbs検定を適用し、汚染データを高精度に検出する方法も開発した。星野は、大規模分割表の分布論について、多項分布の母数が正規化無限分解可能分布の部分族に従うとき、混合分布がベル多項式分布となることを明らかにした。ベル多項式分布が漸近的に正規化無限分解可能分布に収束することが分かり、大標本理論の枠組みが完成した。田畑は、分割表解析におけるダイバージェンスに基づく対称性のモデリングについて、対称性が成り立つための必要十分条件を与えた。片山は、未観測交絡変数が存在し得る状況において proximal causal learning を用いた高次元統計的推測の定式化を行い、推定量の性質を調査した。鈴木は、高次元データにおけるニューラルネットワークの学習に関して、標本数と次元を無限に飛ばす比例極限において、特徴学習を行わない手法は線形関数のみを学習し、勾配法によって特徴学習する手法は非線形成分も学習できることを示した。平均場ニューラルネットワークの最適化における離散化誤差や転移学習のスケーリング則も研究した。松田は、コロナ禍における人流と感染者数の関係を分析するために、ドコモ人流データおよびコロナ感染者数を市区町村別に集計し大規模空間データを構成して、時空間回帰モデルを応用した。 得られた研究成果は国内外の学会や学術誌で発表し、さらに、研究テーマに沿ったシンポジウムを筑波大学・慶應義塾大学・東北大学・東京理科大学・金沢大学で開催した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究計画の3年目として、研究目的を達成するための基礎理論が、ほぼ計画通り完成しつつある。特に、 (1)高次元小標本漸近理論の精密化と体系化 (2)汚染データに頑健な非スパースモデリングの構築 については、当初に計画していた以上の成果が見える。
|
今後の研究の推進方策 |
「現在までの進捗状況」であげた2点に加えて、 (3)高速・頑健・高精度な大規模マルチ・ドメイン学習の構築 (4)高次元統計解析による深層学習の解明 (5)大規模時空間データへの非スパースモデリングの拡張 の3点について重点的に推し進め、研究目的の達成に向けて研究を加速させたい。
|