Project/Area Number |
22K17946
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 61030:Intelligent informatics-related
|
Research Institution | Institute of Physical and Chemical Research (2023) The University of Tokyo (2022) |
Principal Investigator |
石田 隆 国立研究開発法人理化学研究所, 革新知能統合研究センター, 研究員 (80888462)
|
Project Period (FY) |
2022-04-01 – 2027-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2026: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2025: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2024: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2023: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2022: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
|
Keywords | 補ラベル学習 / 機械学習 / MU学習 / 教師あり学習 |
Outline of Research at the Start |
本研究では、少数データ環境であっても汎化性能及び信頼性を高めることを可能とする機械学習技術の研究を行い、2つのアプローチで研究を進める。1つ目は過剰適合を抑制するための方法論の研究であり、機械学習モデルの学習においてさらなる性能の改善を達成することを目指す。2つ目は教師情報における工夫を行うことである。近年、弱教師ラベルの扱い方は盛んに研究されてきたが、本研究では弱教師に限らず強教師も考慮し、汎化性能改善や信頼性向上に向けた新たな問題設定・手法の提案、理論解析を行う。
|
Outline of Annual Research Achievements |
2023年度は補ラベル学習に関する研究を行いました。機械学習の分類問題では、各入力データに対して「クラスAである」「クラスBである」「クラスCである」というように、通常は正しいクラスラベルが与えられます。しかし補ラベル学習では「クラスBではない」「クラスCではない」というような誤りのクラスラベルが教師情報として与えられます。正しいクラスと比べると弱い情報ではあるものの、補ラベルを用いて正しいクラスを予測する分類器を学習することができます。ただし、従来研究では補ラベルの生成過程に強い仮定を置く必要がありました。本年度の研究ではこの仮定を弱め、より現実的な補ラベルの設定に対応できるようになりました。また、少数の補ラベル付きデータで訓練する際の過適合の発生を抑制するため、手法の改善にも取り組みました。理論的な性質を明らかにするとともに、多クラス分類の「1対他」(one versus the rest)の考え方を適用することで、正例とラベルなしデータからの学習と呼ばれる別の問題設定との興味深い繋がりも明らかになりました。様々なデータセットや補ラベル生成方法を試した中では、複数の従来法と比べて提案手法が良い性能を示すことを確認しました。
補ラベルに関する本研究論文は、機械学習分野の国際会議であるThe Forty-first International Conference on Machine Learning(ICML 2024、採択率27.5%)に採択されました。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
補ラベル学習の研究を通して、過剰適合の抑制の研究及び弱教師情報を活用した機械学習の研究が進みました。そのため、おおむね順調に進展していると考えています。
|
Strategy for Future Research Activity |
来年度も引き続き機械学習における教師情報の工夫や汎化性能・信頼性を高めるための技術の研究を進めていく予定です。
|