Developments of statistical compression technology for massive data having tensor structures
Project/Area Number |
22K19769
|
Research Category |
Grant-in-Aid for Challenging Research (Exploratory)
|
Allocation Type | Multi-year Fund |
Review Section |
Medium-sized Section 60:Information science, computer engineering, and related fields
|
Research Institution | University of Tsukuba |
Principal Investigator |
青嶋 誠 筑波大学, 数理物質系, 教授 (90246679)
|
Co-Investigator(Kenkyū-buntansha) |
矢田 和善 筑波大学, 数理物質系, 教授 (90585803)
石井 晶 東京理科大学, 創域理工学部情報計算科学科, 講師 (20801161)
赤平 昌文 筑波大学, 数理物質系(名誉教授), 名誉教授 (70017424)
|
Project Period (FY) |
2022-06-30 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥6,370,000 (Direct Cost: ¥4,900,000、Indirect Cost: ¥1,470,000)
Fiscal Year 2024: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
Fiscal Year 2023: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
Fiscal Year 2022: ¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
|
Keywords | データ圧縮 / 深層学習 / 高次元統計解析 / 巨大データ / 次元の呪い |
Outline of Research at the Start |
深層学習(DL)に代表されるAI技術が進化しているものの、その実現はコンピューターの性能を頼みにし、コスト面からDLを巨大データの解析にそのまま適用することは難しい。近い将来、DLの進歩が経済的にも技術的にも環境的にも持続不可能になるという指摘もある。本研究は、コンピューターの性能に依存した従来の学術体系と方向を大きく変革・転換させ、巨大テンソル型データを低コストで高速かつ高精度に解析できる統計的圧縮技術を開発する。コンピューターの負荷を大きく軽減することで、学術上の突破口を切り拓き、科学技術・産業への革新的展開を目指す。
|
Outline of Annual Research Achievements |
本研究は、コンピューターの性能に依存した従来の学術の体系と方向を大きく変革・転換させ、巨大テンソル型データを低コストで高速かつ高精度に解析できる統計的圧縮技術を開発する。次の3つの研究目的を遂行した。 (1) 巨大データ行列の非スパース性と巨大ノイズの推定論の構築 (2) 3階テンソル型データの次元の呪いの解明と解決法の提案 (3) 巨大テンソル型データの高速・高精度な統計的圧縮技術の開発 (1)について、幾つかのクラスが混在する巨大データ行列に見られる非スパースな潜在空間に関して、その構造を各クラスの階層的構造で捉え特定するための正則条件を導出することに成功した。Aoshima and Yata (2019)のデータ変換法を用いて、非スパースな潜在空間を抽出し、巨大なノイズを特定することにも成功した。(2)について、前年度の研究で、3階テンソル型データにおける次元の呪いの主原因として、行列型の巨大ノイズを特定した。その研究を深化させ、Yata and Aoshima (2010)のクロスデータ行列法を応用し、テンソルを構成する各行列を掛け合わせるというアイディアで巨大ノイズを除去することに成功した。(3)について、巨大テンソル型データのノイズを除去したことで、浮き彫りになった潜在空間を低ランクなテンソルで表現することに成功した。 本研究の成果について、青嶋はドイツで開催された国際会議で基調講演を行った。また、矢田・石井とともに幾つかの国際会議で招待講演を行った。本研究課題に関連する国際シンポジウムを、対面+オンライン(Zoom)のハイブリッド形式により、つくば国際会議場で開催した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
交付申請書に記載した研究の目的に沿って、コンピューターの性能に依存した従来の学術の体系と方向を見直し、巨大テンソル型データを低コストで高速かつ高精度に解析できる統計的圧縮技術の開発を目指した。基礎研究に基づいた応用研究に入り、重要な成果が生まれ始め、新たな国際共同研究にも繋がった。国際会議の基調講演や国際シンポジウムの開催でも研究成果に多くの関心が寄せられ、おおむね順調に進展していると評価できる。
|
Strategy for Future Research Activity |
本研究課題の最終年度において、巨大テンソル型データの高速・高精度な統計的圧縮技術を完成させる。構築した理論と方法論は学術の体系を再構築するものであるため、複数の応用面から慎重に検証し精査する。
|
Report
(2 results)
Research Products
(34 results)