機械学習の汎化性能と信頼性の向上に関する研究

研究課題

研究課題/領域番号	22K17946
研究種目	若手研究
配分区分	基金
審査区分	小区分61030:知能情報学関連
研究機関	国立研究開発法人理化学研究所 (2023) 東京大学 (2022)
研究代表者	石田隆国立研究開発法人理化学研究所, 革新知能統合研究センター, 研究員 (80888462)
研究期間 (年度)	2022-04-01 – 2027-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円) 2026年度: 910千円 (直接経費: 700千円、間接経費: 210千円) 2025年度: 910千円 (直接経費: 700千円、間接経費: 210千円) 2024年度: 910千円 (直接経費: 700千円、間接経費: 210千円) 2023年度: 910千円 (直接経費: 700千円、間接経費: 210千円) 2022年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
キーワード	補ラベル学習 / 機械学習 / MU学習 / 教師あり学習
研究開始時の研究の概要	本研究では、少数データ環境であっても汎化性能及び信頼性を高めることを可能とする機械学習技術の研究を行い、2つのアプローチで研究を進める。１つ目は過剰適合を抑制するための方法論の研究であり、機械学習モデルの学習においてさらなる性能の改善を達成することを目指す。２つ目は教師情報における工夫を行うことである。近年、弱教師ラベルの扱い方は盛んに研究されてきたが、本研究では弱教師に限らず強教師も考慮し、汎化性能改善や信頼性向上に向けた新たな問題設定・手法の提案、理論解析を行う。
研究実績の概要	２０２３年度は補ラベル学習に関する研究を行いました。機械学習の分類問題では、各入力データに対して「クラスAである」「クラスBである」「クラスCである」というように、通常は正しいクラスラベルが与えられます。しかし補ラベル学習では「クラスBではない」「クラスCではない」というような誤りのクラスラベルが教師情報として与えられます。正しいクラスと比べると弱い情報ではあるものの、補ラベルを用いて正しいクラスを予測する分類器を学習することができます。ただし、従来研究では補ラベルの生成過程に強い仮定を置く必要がありました。本年度の研究ではこの仮定を弱め、より現実的な補ラベルの設定に対応できるようになりました。また、少数の補ラベル付きデータで訓練する際の過適合の発生を抑制するため、手法の改善にも取り組みました。理論的な性質を明らかにするとともに、多クラス分類の「１対他」（one versus the rest）の考え方を適用することで、正例とラベルなしデータからの学習と呼ばれる別の問題設定との興味深い繋がりも明らかになりました。様々なデータセットや補ラベル生成方法を試した中では、複数の従来法と比べて提案手法が良い性能を示すことを確認しました。補ラベルに関する本研究論文は、機械学習分野の国際会議であるThe Forty-first International Conference on Machine Learning（ICML 2024、採択率２７.５％）に採択されました。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由補ラベル学習の研究を通して、過剰適合の抑制の研究及び弱教師情報を活用した機械学習の研究が進みました。そのため、おおむね順調に進展していると考えています。
今後の研究の推進方策	来年度も引き続き機械学習における教師情報の工夫や汎化性能・信頼性を高めるための技術の研究を進めていく予定です。

報告書

(2件)

2023 実施状況報告書
2022 実施状況報告書

研究成果
(4件)

すべて 2024 2023

すべて雑誌論文 (2件) (うち国際共著 1件、査読あり 2件、オープンアクセス 2件) 学会発表 (2件) (うち国際学会 2件)

[雑誌論文] Learning with Complementary Labels Revisited: The Selected-Completely-at-Random Setting Is More Practical2024
- 著者名/発表者名
  Wei Wang, Takashi Ishida, Yu-Jie Zhang, Gang Niu, Masashi Sugiyama
- 雑誌名
  
  Proceedings of the Forty-first International Conference on Machine Learning
  
  巻: -
- 関連する報告書
  2023 実施状況報告書
- 査読あり / オープンアクセス
[雑誌論文] Mediated Uncoupled Learning and Validation with Bregman Divergences: Loss Family with Maximal Generality2023
- 著者名/発表者名
  Ikko Yamane, Yann Chevaleyre, Takashi Ishida, Florian Yger
- 雑誌名
  
  Proceedings of The 26th International Conference on Artificial Intelligence and Statistics
  
  巻: 206 ページ: 4768-4801
- 関連する報告書
  2022 実施状況報告書
- 査読あり / オープンアクセス / 国際共著
[学会発表] Learning with Complementary Labels Revisited: The Selected-Completely-at-Random Setting Is More Practical2024
- 著者名/発表者名
  Wei Wang, Takashi Ishida, Yu-Jie Zhang, Gang Niu, Masashi Sugiyama
- 学会等名
  The Forty-first International Conference on Machine Learning
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] Mediated Uncoupled Learning and Validation with Bregman Divergences: Loss Family with Maximal Generality2023
- 著者名/発表者名
  Ikko Yamane, Yann Chevaleyre, Takashi Ishida, Florian Yger
- 学会等名
  The 26th International Conference on Artificial Intelligence and Statistics (AISTATS 2023)
- 関連する報告書
  2022 実施状況報告書
- 国際学会

機械学習の汎化性能と信頼性の向上に関する研究

研究代表者

石田 隆 国立研究開発法人理化学研究所, 革新知能統合研究センター, 研究員 (80888462)

4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] Learning with Complementary Labels Revisited: The Selected-Completely-at-Random Setting Is More Practical2024

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Mediated Uncoupled Learning and Validation with Bregman Divergences: Loss Family with Maximal Generality2023

著者名/発表者名

雑誌名

関連する報告書

[学会発表] Learning with Complementary Labels Revisited: The Selected-Completely-at-Random Setting Is More Practical2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] Mediated Uncoupled Learning and Validation with Bregman Divergences: Loss Family with Maximal Generality2023

著者名/発表者名

学会等名

関連する報告書

石田隆国立研究開発法人理化学研究所, 革新知能統合研究センター, 研究員 (80888462)