2022 Fiscal Year Research-status Report

非確率モデルを用いた統計的推定の枠組みの構築とヘテロな構造を持つデータへの応用

Research Project

Project/Area Number	20K03753
Research Institution	National Graduate Institute for Policy Studies
Principal Investigator	竹之内高志政策研究大学院大学, 政策研究科, 教授 (50403340)
Project Period (FY)	2020-04-01 – 2024-03-31
Keywords	頑健性 / 教師なし学習 / 不均衡分類問題 / 対照学習
Outline of Annual Research Achievements	不均衡分類問題について : 分類問題においてはしばしばクラス間のサンプルサイズ比が著しく偏ってしまう.このような状況においては, 少数の例題しか得られないクラス(例えば正のラベルを持つクラス)の情報を得ることが難しいため, 全体の性能(特に正のクラスを判別する性能)の低下が問題となる. 一方, 実際のデータには, 負とラベル付けされているが, ラベル以外の情報は正ラベルを持つ例題を近く, 正とラベル付されてもおかしくないような例題, 「ニアミス例題」が豊富に含まれている場合がある. 例えば, 洪水のような自然災害を検出する問題が挙げられる.洪水は稀なイベントでありデータセットにはほとんど含まれていないが, 川の水位を観測すると, 「実際には洪水が起こらなかったが水位は堤防高さに近づいた」, というような例題はデータセットに複数含まれている場合がある. 本研究では, このようなニアミス例題に含まれる情報を学習に利用する手法を提案し, ニアミス例題がある程度存在すれば推定量の分散を減少させることが可能であることを示した. 相互情報量を用いた表現学習と外れ値ノイズに対するロバスト化: 対照学習を用いた教師なし表現学習法を扱った. 本研究では, 確率モデルを個別に推定せずに, 確率モデルと事前に設定したノイズ分布の比(密度比)を直接推定することで対照学習を行うことを考えている. 対照学習と相互情報量の最大化との関連性を調べ, ある条件下では密度比の推定が相互情報量の最大化に必要かつ十分であることを示した. また, 対照学習の実用的な手法の多くは最尤推定に基づくものであり, 外れ値ノイズの混入に弱いことが知られている. 外れ値ノイズに対する頑健性を獲得するため, ガンマ-ダイバージェンスを用いた密度比推定を考案し, 手法の頑健性を理論的に保証した.
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 対照学習において, 正規化された確率モデルを個別に推定せずに, 確率モデルと事前に設定したノイズ分布の比(密度比)を直接推定するアプローチの理論的背景の解明とノイズに対する頑健化が実現できた.
Strategy for Future Research Activity	正規化されていない非確率モデルを用いた統計的推定法に関して, サンプリングに基づく方法, 情報幾何的方法に基づく方法の2つのアプローチを検討している.
Causes of Carryover	コロナ禍により, 国際会議・国内の打ち合わせのための旅費が使用できなかった. 国内、国際会議への参加・発表に使用する。

Research Products
(2 results)

All 2022

All Journal Article (2 results) (of which Peer Reviewed: 2 results, Open Access: 2 results)

[Journal Article] Improving imbalanced classification using near-miss instances2022
- Author(s)
  Tanimoto Akira、Yamada So、Takenouchi Takashi、Sugiyama Masashi、Kashima Hisashi
- Journal Title
  
  Expert Systems with Applications
  
  Volume: 201 Pages: 117130～117130
- DOI
  10.1016/j.eswa.2022.117130
- Peer Reviewed / Open Access
[Journal Article] Representation Learning for Maximization of MI, Nonlinear ICA and Nonlinear Subspaces with Robust Density Ratio Estimation.2022
- Author(s)
  H. Sasaki and T. Takenouchi
- Journal Title
  
  Journal of Machine Learning Research
  
  Volume: 23(231) Pages: 1--55
- Peer Reviewed / Open Access

2022 Fiscal Year Research-status Report

非確率モデルを用いた統計的推定の枠組みの構築とヘテロな構造を持つデータへの応用

Principal Investigator

竹之内 高志 政策研究大学院大学, 政策研究科, 教授 (50403340)

Current Status of Research Progress

Reason

Research Products

[Journal Article] Improving imbalanced classification using near-miss instances2022

Author(s)

Journal Title

DOI

[Journal Article] Representation Learning for Maximization of MI, Nonlinear ICA and Nonlinear Subspaces with Robust Density Ratio Estimation.2022

Author(s)

Journal Title

竹之内高志政策研究大学院大学, 政策研究科, 教授 (50403340)