非確率モデルを用いた統計的推定の枠組みの構築とヘテロな構造を持つデータへの応用

Research Project

Project/Area Number	20K03753
Research Category	Grant-in-Aid for Scientific Research (C)
Allocation Type	Multi-year Fund
Section	一般
Review Section	Basic Section 12040:Applied mathematics and statistics-related
Research Institution	National Graduate Institute for Policy Studies (2021-2023) Future University-Hakodate (2020)
Principal Investigator	竹之内高志政策研究大学院大学, 政策研究科, 教授 (50403340)
Project Period (FY)	2020-04-01 – 2025-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000) Fiscal Year 2022: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000) Fiscal Year 2021: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000) Fiscal Year 2020: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Keywords	頑健性 / 対照学習 / 影響関数 / 教師なし学習 / 不均衡分類問題 / 弱ラベル / ニューラルネットワーク / ロバスト / γダイバージェンス / 独立成分分析 / 非確率モデル
Outline of Research at the Start	A: 計算量の効率性の観点から, 非確率モデルを用いて,離散, 連続, およびその他のヘテロな構造を持つデータ(グラフ構造など)に対して, 高精度・高効率に推定・推論を行うことが可能な枠組みを提案し, その性質(精度, 効率等)について理論的な保証を与える. B: Aで提案した枠組みを, データ取得にまつわる様々な状況(ラベル情報の大規模な欠測(PU学習), ノイズに対する頑健性, 不均衡なクラスラベル, マルチタスク対応, few(zero)-shot学習等)に対応可能な形に拡張する.
Outline of Annual Research Achievements	データから確率モデルのパラメーターを推定する際に, 典型的には尤度最大化基準が用いられるが, 採用するモデルによっては, 「確率である」という制約を満たすための正規化項の計算に大きな計算リソースが必要となることがある. このようなモデルに対し効率的にパラメーターを学習するための方法として, 非正規化モデルを用いた対照学習法がある. 従来の対照学習法は, 正規化された確率モデルを経由せずに推定を行うことが可能であるため計算効率は高い一方で, 分布間距離尺度としてKL-ダイバージェンスを用いているためデータセットに含まれる外れ値ノイズに結果が影響を受けやすいという欠点があった. 本研究では分布間距離尺度として, 頑健な推定結果をもたらすことが知られているγ-ダイバージェンスを適用し, 外れ値ノイズに影響を受けづらい頑健な対照学習法を考案した. 提案した手法に対し理論的な解析を行い, 特定の条件の下で推定量が再下降性(ノイズの大きさが極度に大きくなると推定量への影響が消失する)という好ましい性質を持つことを示した. また, 分布間距離尺度として, β-ダイバージェンスを用いた場合についても考察を行い, 同様の頑健性を持つことを示した. 提案した手法のノイズを含んだデータセットに対する振る舞いを, 様々な状況において数値実験により検証し, 再下降性を含む外れ値ノイズに対する頑健性を確認した.
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 対照学習において, 正規化された確率モデルを経由せずに推定を行う方法を, 従来も用いられる分布間距離尺度とは異なる距離尺度を用いて拡張し, 外れ値ノイズに対して頑健な手法を考案することができた. また提案した手法の統計的性質を理論, 数値実験を用いて検証し明らかにすることができた.
Strategy for Future Research Activity	正規化されていない非確率モデルを用いた頑健な対照学習法に対して, 情報量規準に基づくバイアス補正法を援用することで, 適切なモデルを選択することができるような枠組みを構築する.

Report

(4 results)

Research Products
(10 results)

All 2024 2022 2021 2020

All Journal Article (3 results) (of which Peer Reviewed: 3 results, Open Access: 3 results) Presentation (7 results) (of which Int'l Joint Research: 4 results)

[Journal Article] Outlier-robust parameter estimation for unnormalized statistical models2024
- Author(s)
  Hiroaki Sasaki & Takashi Takenouchi
- Journal Title
  
  Japanese Journal of Statistics and Data Science
  
  Volume: - Issue: 1 Pages: 1-30
- DOI
  10.1007/s42081-023-00237-8
- Related Report
  2023 Research-status Report
- Peer Reviewed / Open Access
[Journal Article] Improving imbalanced classification using near-miss instances2022
- Author(s)
  Tanimoto Akira、Yamada So、Takenouchi Takashi、Sugiyama Masashi、Kashima Hisashi
- Journal Title
  
  Expert Systems with Applications
  
  Volume: 201 Pages: 117130-117130
- DOI
  10.1016/j.eswa.2022.117130
- Related Report
  2022 Research-status Report
- Peer Reviewed / Open Access
[Journal Article] Representation Learning for Maximization of MI, Nonlinear ICA and Nonlinear Subspaces with Robust Density Ratio Estimation.2022
- Author(s)
  H. Sasaki and T. Takenouchi
- Journal Title
  
  Journal of Machine Learning Research
  
  Volume: 23(231)
- Related Report
  2022 Research-status Report
- Peer Reviewed / Open Access
[Presentation] スキップコネクション付きニューラルネットワークの理論解析.2021
- Author(s)
  和田孝喜, 竹之内高志.
- Organizer
  第24回情報論的学習理論ワークショップ (IBIS2021).
- Related Report
  2021 Research-status Report
[Presentation] Lower-Bounded Proper Losses for Weakly Supervised Classification.2021
- Author(s)
  Shuhei M Yoshida, Takashi Takenouchi, Masashi Sugiyama.
- Organizer
  Proceedings of the 38th International Conference on Machine Learning
- Related Report
  2021 Research-status Report
- Int'l Joint Research
[Presentation] Lower-Bounded Proper Losses for Weakly Supervised Classification2021
- Author(s)
  吉田周平, 竹之内高志, 杉山将
- Organizer
  第24回情報論的学習理論ワークショップ (IBIS2021).
- Related Report
  2021 Research-status Report
[Presentation] Causal Combinatorial Factorization Machines for Set-wise Recommendation2021
- Author(s)
  Akira Tanimoto, Tomoya Sakai, Takashi Takenouchi, Hisashi Kashima.
- Organizer
  Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD)
- Related Report
  2020 Research-status Report
- Int'l Joint Research
[Presentation] Robust contrastive learning and nonlinear ICA in the presence of outliers2020
- Author(s)
  Hiroaki Sasaki, Takashi Takenouchi, Ricardo Monti, Aapo Hyvarinen
- Organizer
  Uncertainty in Artificial Intelligence (UAI)
- Related Report
  2020 Research-status Report
- Int'l Joint Research
[Presentation] 組合せ的行動空間におけるアウトカム予測2020
- Author(s)
  谷本啓，坂井智哉，竹之内高志，鹿島久嗣
- Organizer
  人工知能学会
- Related Report
  2020 Research-status Report
[Presentation] Regret Minimization for Causal Inference on Large Treatment Space2020
- Author(s)
  Akira Tanimoto, Tomoya Sakai, Takashi Takenouchi, Hisashi Kashima.
- Organizer
  International Conference on Artificial Intelligence and Statistics
- Related Report
  2020 Research-status Report
- Int'l Joint Research

非確率モデルを用いた統計的推定の枠組みの構築とヘテロな構造を持つデータへの応用

Principal Investigator

竹之内 高志 政策研究大学院大学, 政策研究科, 教授 (50403340)

¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)

Current Status of Research Progress

Reason

Report

Research Products

[Journal Article] Outlier-robust parameter estimation for unnormalized statistical models2024

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Improving imbalanced classification using near-miss instances2022

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Representation Learning for Maximization of MI, Nonlinear ICA and Nonlinear Subspaces with Robust Density Ratio Estimation.2022

Author(s)

Journal Title

Related Report

[Presentation] スキップコネクション付きニューラルネットワークの理論解析.2021

Author(s)

Organizer

Related Report

[Presentation] Lower-Bounded Proper Losses for Weakly Supervised Classification.2021

Author(s)

Organizer

Related Report

[Presentation] Lower-Bounded Proper Losses for Weakly Supervised Classification2021

Author(s)

Organizer

Related Report

[Presentation] Causal Combinatorial Factorization Machines for Set-wise Recommendation2021

Author(s)

Organizer

Related Report

[Presentation] Robust contrastive learning and nonlinear ICA in the presence of outliers2020

Author(s)

Organizer

Related Report

[Presentation] 組合せ的行動空間におけるアウトカム予測2020

Author(s)

Organizer

Related Report

[Presentation] Regret Minimization for Causal Inference on Large Treatment Space2020

Author(s)

Organizer

Related Report

竹之内高志政策研究大学院大学, 政策研究科, 教授 (50403340)