• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

限られた教師情報に基づく機械学習手法の開発

研究課題

研究課題/領域番号 19J21094
研究種目

特別研究員奨励費

配分区分補助金
応募区分国内
審査区分 小区分60030:統計科学関連
研究機関東京大学

研究代表者

包 含  東京大学, 情報理工学系研究科, 特別研究員(DC1)

研究期間 (年度) 2019-04-25 – 2022-03-31
研究課題ステータス 完了 (2021年度)
配分額 *注記
3,100千円 (直接経費: 3,100千円)
2021年度: 1,000千円 (直接経費: 1,000千円)
2020年度: 1,000千円 (直接経費: 1,000千円)
2019年度: 1,100千円 (直接経費: 1,100千円)
キーワード機械学習 / 教師付き学習 / 統計的学習理論 / 半教師付き学習
研究開始時の研究の概要

本研究は、現実世界におけるプライバシーやデータ取得のコストなどの制約により不完全な教師データしか得られない状況下における統計的分類、いわゆる弱教師付き分類の適用可能範囲を広げるものである。従来は半教師付き分類やPU分類(正例とラベルなし例のみが手に入る分類問題)において研究が進められてきたが、これを教師なし分類やストリームデータの分類へと拡張する。

研究実績の概要

本研究課題では、現実的な制約のもとで不完全な教師付きデータしか得られないような状況下で、機械学習の適用可能性をより広げることを目的としている。該当年度では、次の項目について研究を行った。
1.自己教師のみしか得られない場合における表現学習:データ科学の大規模化に従い、教師情報を全てのデータに逐一付与することが非現実なケースは少なくない。そのような場合、教師なしのデータから教師情報を何らかの手段で生成し、それを元にしてデータの表現を学習する自己教師付き表現学習が近年盛んに研究されているが、自己教師付き学習は本質的には教師なし学習であるゆえに「正解データ」がなく、学習理論的な性能保証が難しかった。本研究では下流タスクとして教師付き分類を想定したときに、対照学習と呼ばれるある種の自己教師付き表現学習で学習したデータ表現が線形分類性能を向上させることを理論的に示した。ここで示した理論評価は単純な凸解析の結果(Jensenの不等式とFenchel-Youngの不等式)に依拠しており、単純なアプローチにもかかわらず既存の理論における性能評価を指数的に向上させることに成功し、結果としてより厳密に下流タスクの性能を事前に知ることができるようになった。最終的に、対照学習で長年議論の的となっていた「負例の数に最適な数はあるか?」という問いに対して、「負例は多ければ多いほど下流タスク性能の分散は小さくなるが、負例が少ないときに性能が出ないわけではない」という結論を得た。

現在までの達成度 (段落)

令和3年度が最終年度であるため、記入しない。

今後の研究の推進方策

令和3年度が最終年度であるため、記入しない。

報告書

(3件)
  • 2021 実績報告書
  • 2020 実績報告書
  • 2019 実績報告書
  • 研究成果

    (14件)

すべて 2021 2020 2019

すべて 雑誌論文 (6件) (うち国際共著 4件、 査読あり 6件、 オープンアクセス 5件) 学会発表 (8件) (うち国際学会 3件)

  • [雑誌論文] Learning from Noisy Similar and Dissimilar Data2021

    • 著者名/発表者名
      Dan, S., Bao, H., & Sugiyama, M.
    • 雑誌名

      Proceedings of the European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases (ECMLPKDD2021)

      巻: 12976 ページ: 233-249

    • 関連する報告書
      2021 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] Fenchel-Young Losses with Skewed Entropies for Class-posterior Probability Estimation2021

    • 著者名/発表者名
      Bao, H. & Sugiyama, M.
    • 雑誌名

      Proceedings of 24th International Conference on Artificial Intelligence and Statistics (AISTATS2021)

      巻: 130 ページ: 1648-1656

    • 関連する報告書
      2020 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Calibrated Surrogate Maximization of Dice2020

    • 著者名/発表者名
      Nordstrom, M., Bao, H., Lofman, F., Hult, H., Maki, A., & Sugiyama, M.
    • 雑誌名

      Proceedings of 23rd International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI2020)

      巻: 12264 ページ: 269-278

    • 関連する報告書
      2020 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Calibrated Surrogate Losses for Adversarially Robust Classification2020

    • 著者名/発表者名
      Bao, H., Scott, C., & Sugiyama, M.
    • 雑誌名

      Proceedings of 33rd Annual Conference on Learning Theory (COLT2020)

      巻: 125 ページ: 408-451

    • 関連する報告書
      2020 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Calibrated Surrogate Maximization of Linear-fractional Utility in Binary Classification2020

    • 著者名/発表者名
      Bao, H & Sugiyama, M.
    • 雑誌名

      Proceedings of Machine Learning Research

      巻: xx

    • 関連する報告書
      2019 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Imitation Learning from Imperfect Demonstration2019

    • 著者名/発表者名
      Wu, Y.-H., Charoenphakdee, N., Bao, H., Tangkaratt, V., & Sugiyama, M.
    • 雑誌名

      Proceedings of Machine Learning Research

      巻: 97 ページ: 6818-6827

    • 関連する報告書
      2019 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [学会発表] Fenchel-Young Losses with Skewed Entropies2021

    • 著者名/発表者名
      Han Bao
    • 学会等名
      24th Information-Based Induction Sciences Workshop (IBIS2021)
    • 関連する報告書
      2021 実績報告書
  • [学会発表] Calibrated Surrogate Losses for Adversarially Robust Classification2020

    • 著者名/発表者名
      Han Bao
    • 学会等名
      23rd Information-Based Induction Sciences Workshop (IBIS2020)
    • 関連する報告書
      2020 実績報告書
  • [学会発表] Calibrated Surrogate Maximization of Linear-fractional Utility in Binary Classification2020

    • 著者名/発表者名
      Bao, H & Sugiyama, M.
    • 学会等名
      39th Information-Based Induction Sciences and Machine Learning Technical Committee (IBISML039)
    • 関連する報告書
      2019 実績報告書
  • [学会発表] Classification from Pairwise Similarities/Dissimilarities and Unlabeled Data via Empirical Risk Minimization2019

    • 著者名/発表者名
      Shimada, T., Bao, H., Sato, I., & Sugiyama, M.
    • 学会等名
      3rd International Workshop on Symbolic-Neural Learning (SNL2019)
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] Calibrated Surrogate Maximization of Linear-fractional Utility in Binary Classification2019

    • 著者名/発表者名
      Bao, H & Sugiyama, M.
    • 学会等名
      Joint Workshop of BBDC, BZML, and RIKEN AIP
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] Calibrated Surrogate Maximization of Linear-fractional Utility in Binary Classification2019

    • 著者名/発表者名
      Bao, H & Sugiyama, M.
    • 学会等名
      UK-Japan Robotics and AI Research Collaboration Workshops
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] Classification from Pairwise Similarities/Dissimilarities and Unlabeled Data via Empirical Risk Minimization2019

    • 著者名/発表者名
      Shimada, T., Bao, H., Sato, I., & Sugiyama, M.
    • 学会等名
      22nd Information-Based Induction Sciences Workshop (IBIS2019)
    • 関連する報告書
      2019 実績報告書
  • [学会発表] Calibrated Surrogate Maximization of Linear-fractional Utility in Binary Classification2019

    • 著者名/発表者名
      Bao, H & Sugiyama, M.
    • 学会等名
      22nd Information-Based Induction Sciences Workshop (IBIS2019)
    • 関連する報告書
      2019 実績報告書

URL: 

公開日: 2019-05-29   更新日: 2024-03-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi