2023 年度実施状況報告書

転移学習型ヒューリスティクスの数理基盤の構築

研究課題

研究課題/領域番号	23K16960
研究機関	東京大学
研究代表者	高橋昂東京大学, 大学院理学系研究科(理学部), 助教 (90906661)
研究期間 (年度)	2023-04-01 – 2027-03-31
キーワード	半教師あり学習 / 不均衡データ / 転移学習 / 統計力学 / 統計物理学 / レプリカ法
研究実績の概要	今年度は、(i) 線形モデルにおける疑似ラベルを用いた自己学習アルゴリズム、および(ii)クラス不均衡データに基づく線形モデルのアンサンブル学習について、データ数とモデルパラメータ数が比例的に発散する比例的漸近論を用いて解析した。以下でそれぞれの研究の内容について説明する。 (i): 昨年までに導出していた疑似ラベルを用いた自己学習法の漸近的挙動について詳細な解析を行った。その結果、自己学習は学習の繰り返し回数が少ない場合には、若干のノイズを含んだラベルに対してモデルをフィットさせるという直感的な描像のもとに動作し、信頼度の低いラベルをデータから省く疑似ラベル選択（Pseudo-label selection,PLS）というヒューリスティクスが非常に有用であることが明らかとなった。一方、総反復回数が大きい場合には一回一回の更新におけるパラメータの変動量を小さくし、微少な更新を積み重ねる戦略が有効であることが明らかとなった。これは、疑似ラベルの損失が、パラメータ更新時に蓄積されうるノイズを打ち消す正則化のような役割を果たすためである。 (ii): ２成分クラスターデータの分類において線形分類器を学習する設定におけるアンダーバギング法の平均場理論を構築し解析した。その結果、アンダーバギング法に基づいて得られる分類器は、アンダーサンプリング法を用いて得られる分類器と比較して、分類面とクラスター中心の相関の情報は等価であるものの、分散の項がバギングによって低減することによってアンダーサンプリング単体よりも高い汎化性能を発揮することが明らかとなった。これはL2正則化がバギングと等価な性能を与える通常のバギング法とは異なる挙動であり、モデルのパラメータに対する直接的な正則化とアンサンブル学習の本質的な違いを示しているとも考えられる。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由２０２３年度は［手法１：疑似ラベルを用いた半教師あり学習］、および［手法２：不均衡データに対する２段階学習］について、ベースライン手法の解析を行い、次年度に発展的方法へと進む基礎を構築する計画であった。［手法２］についてはベースライン手法であるアンサンブル学習法による学習の解析が完了し、汎化性能が向上する機構もある程度明確となった。いっぽう、［手法１］については対抗馬となる手法の解析が遅れている状況にあるが、線形モデルの挙動からモデルパラメータ数がデータ数よりも少ない古典的な状況における振る舞いについては当初想定していた以上に動作機構が明快となっている。単にベースラインとの性能を比較するのみならず、自己学習の機構を明らかにする手がかりを得た状況にあると言える。以上を総合的に考慮して、「おおむね順調に進展している」と考えている。
今後の研究の推進方策	2023年度までの研究により、疑似ラベルを用いた自己学習の古典的設定における基本的構造、および不均衡データからの学習の基本手法の構造が明らかとなった。次年度は、疑似ラベルを用いた自己学習については、回帰やオーバパラメトライズドモデルの研究により、非古典的状況と古典的状況の対比を明確化する研究を行う。また、不均衡データからの学習については、２段階学習を行うことにより、素朴なアンダーサンプリング法と比較して、分散の低減とシグナル項の増大の両方が実現可能となるか否かと検討する。
次年度使用額が生じた理由	２月時点で少額の未使用額が発生したものの、その年度内で適切に使用するべき特別な目的が見当たらなかったため、無理に消費せずに翌年度への繰り越しを決定した。繰り越された予算については、次年度の計画の一環として、旅費等の項目に合算して使用する。少額であるため、特に計画に大きな変更は生じないものと考えている。

研究成果
(8件)

すべて 2024 2023

すべて雑誌論文 (3件) (うち国際共著 3件、査読あり 3件、オープンアクセス 1件) 学会発表 (5件) (うち国際学会 2件、招待講演 1件)

[雑誌論文] Compressed Sensing Radar Detectors Under the Row-Orthogonal Design Model: A Statistical Mechanics Perspective2023
- 著者名/発表者名
  Na Siqi、Huang Tianyao、Liu Yimin、Takahashi Takashi、Kabashima Yoshiyuki、Wang Xiqin
- 雑誌名
  
  IEEE Transactions on Signal Processing
  
  巻: 71 ページ: 2668～2682
- DOI
  10.1109/TSP.2023.3297743
- 査読あり / 国際共著
[雑誌論文] Role of Bootstrap Averaging in Generalized Approximate Message Passing2023
- 著者名/発表者名
  Takahashi Takashi
- 雑誌名
  
  IEEE International Symposium on Information Theory (ISIT)
  
  巻: 2023 ページ: 767～772
- DOI
  10.1109/ISIT54713.2023.10206490
- 査読あり / 国際共著
[雑誌論文] Average case analysis of Lasso under ultra sparse conditions2023
- 著者名/発表者名
  Koki Okajima, Xiangming Meng, Takashi Takahashi, Yoshiyuki Kabashima
- 雑誌名
  
  Proceedings of The 26th International Conference on Artificial Intelligence and Statistics, PMLR
  
  巻: 206 ページ: 11317～11330
- 査読あり / オープンアクセス / 国際共著
[学会発表] 交互最適化法のダイナミクスについて2024
- 著者名/発表者名
  岡島光希, 髙橋昂
- 学会等名
  日本物理学会2024年春季大会
[学会発表] 疑似ラベルの構成法について2024
- 著者名/発表者名
  髙橋昂
- 学会等名
  日本物理学会2024年春季大会
[学会発表] Exploring bagging with structured data: Insights from precise asymptotics2023
- 著者名/発表者名
  Takashi Takahashi
- 学会等名
  Exploring bagging with structured data: Insights from precise asymptotics
- 国際学会 / 招待講演
[学会発表] A Statistical Mechanics Analysis of Iterative Self-Training2023
- 著者名/発表者名
  Takashi Takahashi
- 学会等名
  STATPHYS28
- 国際学会
[学会発表] 高次元モデルにおける不均衡データ分類2023
- 著者名/発表者名
  髙橋昂
- 学会等名
  日本物理学会第78回年次大会

2023 年度 実施状況報告書

転移学習型ヒューリスティクスの数理基盤の構築

研究代表者

高橋 昂 東京大学, 大学院理学系研究科(理学部), 助教 (90906661)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Compressed Sensing Radar Detectors Under the Row-Orthogonal Design Model: A Statistical Mechanics Perspective2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Role of Bootstrap Averaging in Generalized Approximate Message Passing2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Average case analysis of Lasso under ultra sparse conditions2023

著者名/発表者名

雑誌名

[学会発表] 交互最適化法のダイナミクスについて2024

著者名/発表者名

学会等名

[学会発表] 疑似ラベルの構成法について2024

著者名/発表者名

学会等名

[学会発表] Exploring bagging with structured data: Insights from precise asymptotics2023

著者名/発表者名

学会等名

[学会発表] A Statistical Mechanics Analysis of Iterative Self-Training2023

著者名/発表者名

学会等名

[学会発表] 高次元モデルにおける不均衡データ分類2023

著者名/発表者名

学会等名

2023 年度実施状況報告書

高橋昂東京大学, 大学院理学系研究科(理学部), 助教 (90906661)