2023 Fiscal Year Annual Research Report
Unified approach for data sampling problems based on online prediction theory
Project/Area Number |
21K12032
|
Research Institution | Yokohama City University |
Principal Investigator |
末廣 大貴 横浜市立大学, データサイエンス学部, 准教授 (20786967)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | データサンプリング / 機械学習 / オンライン予測 |
Outline of Annual Research Achievements |
前年度に採択された国際会議ICASSP2023で研究発表を行った.また,前年度までに開発した統合的なデータサンプリングの枠組みに関し,論文執筆,投稿し,機械学習において権威のあるジャーナル Machine Learningに掲載され,ECML/PKDD2023において研究発表も行った. 全体を通し,機械学習における様々なデータサンプリング問題に対し,オンライン予測理論に基づく統合的定式化と理論解析を行った.具体的には,Lerning from Label Proportions と呼ばれる学習問題における疑似ラベル選択,ノイズラベルあり学習問題におけるノイズデータ回避を考え,学習器の挙動に応じて適応的にデータをサンプリングする統合的な枠組みを構築した.従来はデータの性質やタスクに依存したサンプリングが多く,汎用性や理論解析に関する議論が少なかった中,タスクもデータの性質も異なるような学習問題に対し統合的な枠組みを与えたことは大きな成果である.また,いずれの問題においても理論的に適切なサンプリングが行えることを証明し,かつ実験的にも最新手法を超える性能を達成することを示した.具体的には,オンライン予測理論に基づいた定式化を行ったことで,リグレット解析とよばれる枠組みでサンプリングの効果を理論的に評価することが可能となった.オンライン予測理論をサンプリングに活用した事自体が世界初であり,機械学習分野の一大分野であるオンライン予測の発展にも大きく寄与した.
|