研究課題
前年度に採択された国際会議ICASSP2023で研究発表を行った.また,前年度までに開発した統合的なデータサンプリングの枠組みに関し,論文執筆,投稿し,機械学習において権威のあるジャーナル Machine Learningに掲載され,ECML/PKDD2023において研究発表も行った.全体を通し,機械学習における様々なデータサンプリング問題に対し,オンライン予測理論に基づく統合的定式化と理論解析を行った.具体的には,Lerning from Label Proportions と呼ばれる学習問題における疑似ラベル選択,ノイズラベルあり学習問題におけるノイズデータ回避を考え,学習器の挙動に応じて適応的にデータをサンプリングする統合的な枠組みを構築した.従来はデータの性質やタスクに依存したサンプリングが多く,汎用性や理論解析に関する議論が少なかった中,タスクもデータの性質も異なるような学習問題に対し統合的な枠組みを与えたことは大きな成果である.また,いずれの問題においても理論的に適切なサンプリングが行えることを証明し,かつ実験的にも最新手法を超える性能を達成することを示した.具体的には,オンライン予測理論に基づいた定式化を行ったことで,リグレット解析とよばれる枠組みでサンプリングの効果を理論的に評価することが可能となった.オンライン予測理論をサンプリングに活用した事自体が世界初であり,機械学習分野の一大分野であるオンライン予測の発展にも大きく寄与した.
すべて 2024 2023
すべて 雑誌論文 (2件) (うち査読あり 1件) 学会発表 (2件) (うち国際学会 1件)
Machine Learning
巻: 113 ページ: 1163~1188
10.1007/s10994-023-06478-8
Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing 2023
巻: - ページ: 1~5
10.1109/ICASSP49357.2023.10097069