• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Annual Research Report

Innovative Developments of Theories and Methodologies for Large Complex Data

Research Project

Project/Area Number 20H00576
Research InstitutionUniversity of Tsukuba

Principal Investigator

青嶋 誠  筑波大学, 数理物質系, 教授 (90246679)

Co-Investigator(Kenkyū-buntansha) 矢田 和善  筑波大学, 数理物質系, 准教授 (90585803)
松田 安昌  東北大学, 経済学研究科, 教授 (10301590)
星野 伸明  金沢大学, 経済学経営学系, 教授 (00313627)
田畑 耕治  東京理科大学, 理工学部情報科学科, 教授 (30453814)
片山 翔太  慶應義塾大学, 経済学部(三田), 准教授 (50742459)
鈴木 大慈  東京大学, 大学院情報理工学系研究科, 准教授 (60551372)
中山 優吾  京都大学, 情報学研究科, 助教 (40884169)
Project Period (FY) 2020-04-01 – 2025-03-31
Keywords高次元データ / 時空間データ / 高次元統計解析 / 深層学習 / 高次元小標本
Outline of Annual Research Achievements

青嶋と矢田は、ノイズ掃き出し法に閾値を設けた正則化PCAを考え、高次元データの潜在構造推定法を開発し、潜在ベクトルの推定と変数選択を同時に処理する高精度な高次元クラスタリングを可能にした。高次元データは3つの階層構造に分類されることを証明した。青嶋と矢田と中山は、汚染データを主成分空間に炙り出す幾何学的方法を開発した。主成分スコアにSmirnov-Grubbs検定を適用し、汚染データを高精度に検出する方法も開発した。星野は、大規模分割表の分布論について、多項分布の母数が正規化無限分解可能分布の部分族に従うとき、混合分布がベル多項式分布となることを明らかにした。ベル多項式分布が漸近的に正規化無限分解可能分布に収束することが分かり、大標本理論の枠組みが完成した。田畑は、分割表解析におけるダイバージェンスに基づく対称性のモデリングについて、対称性が成り立つための必要十分条件を与えた。片山は、未観測交絡変数が存在し得る状況において proximal causal learning を用いた高次元統計的推測の定式化を行い、推定量の性質を調査した。鈴木は、高次元データにおけるニューラルネットワークの学習に関して、標本数と次元を無限に飛ばす比例極限において、特徴学習を行わない手法は線形関数のみを学習し、勾配法によって特徴学習する手法は非線形成分も学習できることを示した。平均場ニューラルネットワークの最適化における離散化誤差や転移学習のスケーリング則も研究した。松田は、コロナ禍における人流と感染者数の関係を分析するために、ドコモ人流データおよびコロナ感染者数を市区町村別に集計し大規模空間データを構成して、時空間回帰モデルを応用した。
得られた研究成果は国内外の学会や学術誌で発表し、さらに、研究テーマに沿ったシンポジウムを筑波大学・慶應義塾大学・東北大学・東京理科大学・金沢大学で開催した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

研究計画の3年目として、研究目的を達成するための基礎理論が、ほぼ計画通り完成しつつある。特に、
(1)高次元小標本漸近理論の精密化と体系化
(2)汚染データに頑健な非スパースモデリングの構築
については、当初に計画していた以上の成果が見える。

Strategy for Future Research Activity

「現在までの進捗状況」であげた2点に加えて、
(3)高速・頑健・高精度な大規模マルチ・ドメイン学習の構築
(4)高次元統計解析による深層学習の解明
(5)大規模時空間データへの非スパースモデリングの拡張
の3点について重点的に推し進め、研究目的の達成に向けて研究を加速させたい。

  • Research Products

    (40 results)

All 2023 2022 Other

All Int'l Joint Research (5 results) Journal Article (11 results) (of which Int'l Joint Research: 5 results,  Peer Reviewed: 9 results,  Open Access: 8 results) Presentation (21 results) (of which Int'l Joint Research: 9 results,  Invited: 11 results) Remarks (2 results) Funded Workshop (1 results)

  • [Int'l Joint Research] Princeton University/University of North Carolina/Microsoft Research(米国)

    • Country Name
      U.S.A.
    • Counterpart Institution
      Princeton University/University of North Carolina/Microsoft Research
  • [Int'l Joint Research] University of Toronto/Vector Institute(カナダ)

    • Country Name
      CANADA
    • Counterpart Institution
      University of Toronto/Vector Institute
  • [Int'l Joint Research] Academia Sinica(中国)

    • Country Name
      CHINA
    • Counterpart Institution
      Academia Sinica
  • [Int'l Joint Research] Seoul National University(韓国)

    • Country Name
      KOREA (REP. OF KOREA)
    • Counterpart Institution
      Seoul National University
  • [Int'l Joint Research] University of Stavanger(ノルウェー)

    • Country Name
      NORWAY
    • Counterpart Institution
      University of Stavanger
  • [Journal Article] Statistical hypothesis testing for high-dimension, low-sample-size data2023

    • Author(s)
      Aoshima Makoto, Ishii Aki, Yata Kazuyoshi
    • Journal Title

      American Mathematical Society, Sugaku Expositions

      Volume: ー Pages: ー

    • Peer Reviewed
  • [Journal Article] Uniform-in-time propagation of chaos for the mean field gradient Langevin dynamics2023

    • Author(s)
      Taiji Suzuki, Atsushi Nitanda, Denny Wu
    • Journal Title

      The 11th International Conference on Learning Representations

      Volume: ー Pages: ー

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] 高次元現象の統計数理2022

    • Author(s)
      青嶋誠
    • Journal Title

      日本数学会秋季総合分科会総合講演・企画特別講演アブストラクト

      Volume: ー Pages: 51~61

  • [Journal Article] Geometric classifiers for high-dimensional noisy data2022

    • Author(s)
      Ishii Aki、Yata Kazuyoshi、Aoshima Makoto
    • Journal Title

      Journal of Multivariate Analysis

      Volume: 188 Pages: 104850~104850

    • DOI

      10.1016/j.jmva.2021.104850

    • Peer Reviewed / Open Access
  • [Journal Article] 階層的クラスタリングの高次元漸近的性質について2022

    • Author(s)
      江頭健斗, 矢田和善, 青嶋誠
    • Journal Title

      数理解析研究所講究録

      Volume: 2221 Pages: 30~37

    • Open Access
  • [Journal Article] Consistency of the objective general index in high-dimensional settings2022

    • Author(s)
      Bando Takuma、Sei Tomonari、Yata Kazuyoshi
    • Journal Title

      Journal of Multivariate Analysis

      Volume: 189 Pages: 104938~104938

    • DOI

      10.1016/j.jmva.2021.104938

    • Peer Reviewed / Open Access
  • [Journal Article] Advances in Quasi-Symmetry for Square Contingency Tables2022

    • Author(s)
      Tahata Kouji
    • Journal Title

      Symmetry

      Volume: 14 Pages: 1051~1051

    • DOI

      10.3390/sym14051051

    • Peer Reviewed / Open Access
  • [Journal Article] High-dimensional asymptotics of feature learning: How one gradient step improves the representation2022

    • Author(s)
      Jimmy Ba, Murat A. Erdogdu, Taiji Suzuki, Zhichao Wang, Denny Wu, Greg Yang
    • Journal Title

      Advances in Neural Information Processing Systems

      Volume: 35 Pages: 32612~32623

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Escaping Saddle Points with Bias-Variance Reduced Local Perturbed SGD for Communication Efficient Nonconvex Distributed Learning2022

    • Author(s)
      Tomoya Murata, Taiji Suzuki
    • Journal Title

      Advances in Neural Information Processing Systems

      Volume: 35 Pages: 5039~5051

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] A Scaling Law for Synthetic-to-Real Transfer: How Much Is Your Pre-training Effective?2022

    • Author(s)
      Mikami Hiroaki、Fukumizu Kenji、Murai Shogo、Suzuki Shuji、Kikuchi Yuta、Suzuki Taiji、Maeda Shin-ichi、Hayashi Kohei
    • Journal Title

      Proceedings of Machine Learning and Knowledge Discovery in Databases, Part III. Springer Lecture Notes in Computer Science

      Volume: 13715 Pages: 477~492

    • DOI

      10.1007/978-3-031-26409-2_29

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Estimating spatial regression models with sample data-points: A Gibbs sampler solution2022

    • Author(s)
      Arbia Giuseppe、Matsuda Yasumasa、Wu Junyue
    • Journal Title

      Spatial Statistics

      Volume: 47 Pages: 100568~100568

    • DOI

      10.1016/j.spasta.2021.100568

    • Peer Reviewed / Int'l Joint Research
  • [Presentation] 高次元小標本における非階層型クラスタリングの一致性について2023

    • Author(s)
      江頭健斗, 矢田和善,青嶋誠
    • Organizer
      京都大学数理解析研究所研究集会「種々の統計的モデルにおける推測方式の有効性」
  • [Presentation] 高次元現象の統計数理2022

    • Author(s)
      青嶋誠
    • Organizer
      日本数学会秋季総合分科会(企画特別講演)
    • Invited
  • [Presentation] Estimation of eigenvectors for linear combinations of high-dimensional covariance matrices and its applications2022

    • Author(s)
      Kazuyoshi Yata, Aki Ishii, Makoto Aoshima
    • Organizer
      The 5th International Conference on Econometrics and Statistics
    • Int'l Joint Research / Invited
  • [Presentation] Asymptotic behaviors of hierarchical clustering under high dimensional settings2022

    • Author(s)
      Kento Egashira, Kazuyoshi Yata, Makoto Aoshima
    • Organizer
      The 5th International Conference on Econometrics and Statistics
    • Int'l Joint Research / Invited
  • [Presentation] Geometric classifiers for high-dimensional noisy data2022

    • Author(s)
      Kazuyoshi Yata, Aki Ishii, Makoto Aoshima
    • Organizer
      JMVA 50th Jubilee volume follow-up webinar
    • Int'l Joint Research / Invited
  • [Presentation] High dimensional and low sample size case statistics for the screening on crystal information of the solid-state electrolytes2022

    • Author(s)
      Hirotaka Sakamoto, Kazuyoshi Yata, Hisatsugu Yamaski, Makoto Aoshima
    • Organizer
      2022 Materials Research Society Spring Meeting
    • Int'l Joint Research
  • [Presentation] 強スパイク固有値モデルにおける高次元統計的推測2022

    • Author(s)
      矢田和善
    • Organizer
      応用統計学会年会(特別講演)
    • Invited
  • [Presentation] 階層的クラスタリングの高次元漸近的振舞い2022

    • Author(s)
      江頭健斗, 矢田和善,青嶋誠
    • Organizer
      日本数学会秋季総合分科会
  • [Presentation] Hierarchical clustering and its asymptotic behaviors in high-dimensional settings2022

    • Author(s)
      江頭健斗, 矢田和善,青嶋誠
    • Organizer
      科研費シンポジウム「統計科学の開拓」
  • [Presentation] A family of generalized multinomial distribution2022

    • Author(s)
      Hoshino, N.
    • Organizer
      International Conference on Statistical Distributions and Applications 2022
    • Int'l Joint Research / Invited
  • [Presentation] Discretizing the normalized infinitely divisible distribution2022

    • Author(s)
      星野伸明
    • Organizer
      2022年度統計関連学会連合大会
  • [Presentation] 正方分割表における準対称性とその周辺2022

    • Author(s)
      田畑耕治
    • Organizer
      応用統計学会
    • Invited
  • [Presentation] 高次元データにおける交絡調整を伴う最大値型検定2022

    • Author(s)
      片山翔太
    • Organizer
      統計関連学会連合大会
  • [Presentation] 未測定交絡因子が存在する場合における制御された直接効果の推定法とその性質について2022

    • Author(s)
      岡本憲曉, 片山翔太, 星野崇宏
    • Organizer
      日本計算機統計学会第36回シンポジウム
  • [Presentation] 高次元データ学習における特徴学習の優位性2022

    • Author(s)
      鈴木大慈
    • Organizer
      科研費シンポジウム「大規模複雑データの理論と方法論~新たな発展と関連分野への応用~」
  • [Presentation] Deep learning theory from feature learning perspective2022

    • Author(s)
      Taiji Suzuki
    • Organizer
      The 14th Asian Conference on Machine Learning (Keynote talk)
    • Int'l Joint Research / Invited
  • [Presentation] Convolutional regression for big spatial data2022

    • Author(s)
      Yasumasa Matsuda
    • Organizer
      The 5th International Conference on Econometrics and Statistics
    • Int'l Joint Research / Invited
  • [Presentation] Spatial regression discontinuity design2022

    • Author(s)
      Masayuki Sawada, Yasumasa Matsuda, Daisuke Kurisu, Takuya Ishihara
    • Organizer
      Risk and Statistics, 3rd Tohoku-ISM-Ulm joint workshop
    • Int'l Joint Research / Invited
  • [Presentation] Test for outlier detection by high-dimensional PCA2022

    • Author(s)
      Yugo Nakayama, Kazuyoshi Yata, Makoto Aoshima
    • Organizer
      The 5th International Conference on Econometrics and Statistics
    • Int'l Joint Research / Invited
  • [Presentation] Multiple outlier detection test with PCA in high-dimension, low-sample-size settings2022

    • Author(s)
      中山優吾, 矢田和善, 青嶋誠
    • Organizer
      統計関連学会連合大会
  • [Presentation] 高次元主成分分析における頑健性について2022

    • Author(s)
      中山優吾, 矢田和善, 青嶋誠
    • Organizer
      日本数学会秋季総合分科会
  • [Remarks] 青嶋研究室ホームページ

    • URL

      https://www.math.tsukuba.ac.jp/~aoshima-lab/jp/

  • [Remarks] 青嶋研究室ホームページ 科研費基盤研究(A) シンポジウム

    • URL

      https://www.math.tsukuba.ac.jp/~aoshima-lab/jp/kiban_A.html

  • [Funded Workshop] Risk and Statistics, - 3rd Tohoku-Ulm-ISM joint workshop2022

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi