• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

オンライン予測理論に基づくデータサンプリング問題への統合的アプローチ

研究課題

研究課題/領域番号 21K12032
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分61030:知能情報学関連
研究機関横浜市立大学 (2023)
九州大学 (2021-2022)

研究代表者

末廣 大貴  横浜市立大学, データサイエンス学部, 准教授 (20786967)

研究期間 (年度) 2021-04-01 – 2024-03-31
研究課題ステータス 完了 (2023年度)
配分額 *注記
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
キーワードデータサンプリング / オンライン予測 / ノイズあり機械学習 / 機械学習 / 組み合わせ最適化 / ノイズラベル / ノイズデータ
研究開始時の研究の概要

本研究では,機械学習分野におけるデータサンプリング問題に対し,統合的な定式化と理論解析の枠組みを与えることを目指す.データサンプリングは,全てのサンプルを学習に用いるのではなく,可能な限り「望ましいデータ」のみをサンプリングするタスクのことで, 多くのドメインで幅広く考えられているタスクである.従来は,ドメイン,タスクの細かい特性に応じたアドホックな定式化や手法が多く,汎用性や理論解析に関する議論が欠如している.本研究では, ドメイン,タスク依存の現状を打破するため,データサンプリング問題について(1)統合的な枠組みの開発,(2)理論性能保証,(3)実応用の開拓を行う.

研究成果の概要

機械学習における様々なデータサンプリング問題に対し,オンライン予測理論に基づく統合的定式化と理論解析を行った.具体的には,Lerning from Label Proportions と呼ばれる学習問題における疑似ラベル選択,ノイズラベルあり学習問題におけるノイズデータ回避を考え,学習器の挙動に応じて適応的にデータをサンプリングする統合的な枠組みを構築した.いずれの問題においても理論的に適切なサンプリングが行えることを証明し,かつ実験的にも最新手法を超える性能を達成することを示した.

研究成果の学術的意義や社会的意義

データから学習を行う機械学習は人工知能の中核をなす技術である.一般に,データに付与される「正解」は誤り(ノイズ)が含まれていたり,全てのデータに付与されていなかったり,不完全なものであることが多い.このようなデータから適切な学習を行うためには,データ集合の中から適切な情報だけを取り出すサンプリングが重要な役割を担う.しかし,サンプリングはデータの性質やタスクに応じたアドホックな定式化や手法が多く,汎用性や理論解析に関する議論が欠如していた.本研究ではデータやタスク依存の現状を打破する統合的な枠組みと理論性能保証の指針を与え,サンプリング技術ひいては機械学習技術の発展に大きく寄与するものである.

報告書

(4件)
  • 2023 実績報告書   研究成果報告書 ( PDF )
  • 2022 実施状況報告書
  • 2021 実施状況報告書
  • 研究成果

    (6件)

すべて 2024 2023 2021

すべて 雑誌論文 (3件) (うち国際共著 2件、 査読あり 2件、 オープンアクセス 2件) 学会発表 (3件) (うち国際学会 1件)

  • [雑誌論文] No regret sample selection with noisy labels2024

    • 著者名/発表者名
      Song Heon、Mitsuo Nariaki、Uchida Seiichi、Suehiro Daiki
    • 雑誌名

      Machine Learning

      巻: 113 号: 3 ページ: 1163-1188

    • DOI

      10.1007/s10994-023-06478-8

    • 関連する報告書
      2023 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] Learning From Label Proportion with Online Pseudo-Label Decision by Regret Minimization2023

    • 著者名/発表者名
      Matsuo Shinnosuke、Bise Ryoma、Uchida Seiichi、Suehiro Daiki
    • 雑誌名

      Proceedings of the 47th International Conference on Acoustics, Speech, and Signal Processing

      巻: - ページ: 1-5

    • DOI

      10.1109/icassp49357.2023.10097069

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] No Regret Sample Selection with Noisy Labels2021

    • 著者名/発表者名
      Heon Song, Nariaki Mitsuo, Seiichi Uchida, Daiki Suehiro
    • 雑誌名

      arXiv preprint 2003.03179

      巻: -

    • 関連する報告書
      2021 実施状況報告書
    • オープンアクセス / 国際共著
  • [学会発表] No Regret Sample Selection with Noisy Labels2023

    • 著者名/発表者名
      Heon Song, Nariaki Mitsuo, Seiichi Uchida, Daiki Suehiro
    • 学会等名
      European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases 2023
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] ノイズラベルを含むデータに対する適応的サンプリングの枠組み2023

    • 著者名/発表者名
      ソン ホン, 満尾成亮, 内田誠一, 末廣大貴
    • 学会等名
      第26回情報論的学習理論ワークショップ
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 識別器の斟酌学習2021

    • 著者名/発表者名
      本田康祐,内田誠一,末廣大貴
    • 学会等名
      電子情報通信学会 パターン認識・メディア理解研究会(PRMU研究会)
    • 関連する報告書
      2021 実施状況報告書

URL: 

公開日: 2021-04-28   更新日: 2025-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi