2022 Fiscal Year Research-status Report
Developments of statistical compression technology for massive data having tensor structures
Project/Area Number |
22K19769
|
Research Institution | University of Tsukuba |
Principal Investigator |
青嶋 誠 筑波大学, 数理物質系, 教授 (90246679)
|
Co-Investigator(Kenkyū-buntansha) |
矢田 和善 筑波大学, 数理物質系, 准教授 (90585803)
石井 晶 東京理科大学, 理工学部情報科学科, 嘱託特別講師 (20801161)
赤平 昌文 筑波大学, 数理物質系(名誉教授), 名誉教授 (70017424)
|
Project Period (FY) |
2022-06-30 – 2025-03-31
|
Keywords | データ圧縮 / 深層学習 / 高次元統計解析 / 巨大データ / 次元の呪い |
Outline of Annual Research Achievements |
本研究は、コンピューターの性能に依存した従来の学術の体系と方向を大きく変革・転換させ、巨大テンソル型データを低コストで高速かつ高精度に解析できる統計的圧縮技術を開発する。次の3つの研究目的を遂行した。 (1) 巨大データ行列の非スパース性と巨大ノイズの推定論の構築 (2) 3階テンソル型データの次元の呪いの解明と解決法の提案 (3) 巨大テンソル型データの高速・高精度な統計的圧縮技術の開発 (1)について、幾つかのクラスが混在する巨大データ行列において、クラス間の潜在構造の差異を非スパース性で捉え、さらにデータの巨大ノイズの漸近的挙動を確率変動で捉えることで、各クラスがもつ階層構造を高精度に抽出する方法を提案した。(2)について、多重線形主成分分析法を用いて、3階テンソル型データにおける潜在構造推定に一致性が成立するための条件を導出した。この条件から、3階テンソル型データにおいて次元の呪いの主原因となる行列型の巨大ノイズが特定された。(3)について、データの潜在情報の抽出と変数選択を同時に処理できる新たな高次元主成分分析法を考案した。これを巨大テンソル型データに前処理として施すことによって、データサイズの大幅な圧縮が可能となる。本研究の成果について、青嶋は日本数学会に招待され秋季総合分科会で企画特別講演を行った。また、矢田・石井とともに幾つかの国際会議で招待講演を行った。本研究課題に関連するシンポジウムを、対面+オンライン(Zoom)のハイブリッド形式により、つくば国際会議場で開催した。なお、本研究課題に関連して、矢田は筑波大学Best Faculty Member Awardを受賞し、石井は日本統計学会小川研究奨励賞を受賞した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
交付申請書に記載した研究の目的に沿って、コンピューターの性能に依存した従来の学術の体系と方向を見直し、巨大テンソル型データを低コストで高速かつ高精度に解析できる統計的圧縮技術の開発を目指した。数学的基礎となる重要な成果が得られ、シンポジウムも開催し、研究成果について活発な意見交換が行われた。おおむね順調に進展していると評価できる。
|
Strategy for Future Research Activity |
高速かつ高精度な解析を低コストで実現すべく、理論と方法論の両面から巨大テンソル型データの統計的圧縮技術の開発を進め、学術の体系を再構築する。
|
Causes of Carryover |
分担者の一人が研究開始時点から産休に入ったため、当初の計画を変更することとなった。本年4月から無事に職場に復帰されたので、無理のないように研究を担当して、無理のないように分担金を使用してもらうように計画を立てている。
|
Research Products
(14 results)