研究課題/領域番号 |
22K17946
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 国立研究開発法人理化学研究所 (2023) 東京大学 (2022) |
研究代表者 |
石田 隆 国立研究開発法人理化学研究所, 革新知能統合研究センター, 研究員 (80888462)
|
研究期間 (年度) |
2022-04-01 – 2027-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2026年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2025年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2024年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2023年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2022年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
|
キーワード | 補ラベル学習 / 機械学習 / MU学習 / 教師あり学習 |
研究開始時の研究の概要 |
本研究では、少数データ環境であっても汎化性能及び信頼性を高めることを可能とする機械学習技術の研究を行い、2つのアプローチで研究を進める。1つ目は過剰適合を抑制するための方法論の研究であり、機械学習モデルの学習においてさらなる性能の改善を達成することを目指す。2つ目は教師情報における工夫を行うことである。近年、弱教師ラベルの扱い方は盛んに研究されてきたが、本研究では弱教師に限らず強教師も考慮し、汎化性能改善や信頼性向上に向けた新たな問題設定・手法の提案、理論解析を行う。
|
研究実績の概要 |
2023年度は補ラベル学習に関する研究を行いました。機械学習の分類問題では、各入力データに対して「クラスAである」「クラスBである」「クラスCである」というように、通常は正しいクラスラベルが与えられます。しかし補ラベル学習では「クラスBではない」「クラスCではない」というような誤りのクラスラベルが教師情報として与えられます。正しいクラスと比べると弱い情報ではあるものの、補ラベルを用いて正しいクラスを予測する分類器を学習することができます。ただし、従来研究では補ラベルの生成過程に強い仮定を置く必要がありました。本年度の研究ではこの仮定を弱め、より現実的な補ラベルの設定に対応できるようになりました。また、少数の補ラベル付きデータで訓練する際の過適合の発生を抑制するため、手法の改善にも取り組みました。理論的な性質を明らかにするとともに、多クラス分類の「1対他」(one versus the rest)の考え方を適用することで、正例とラベルなしデータからの学習と呼ばれる別の問題設定との興味深い繋がりも明らかになりました。様々なデータセットや補ラベル生成方法を試した中では、複数の従来法と比べて提案手法が良い性能を示すことを確認しました。
補ラベルに関する本研究論文は、機械学習分野の国際会議であるThe Forty-first International Conference on Machine Learning(ICML 2024、採択率27.5%)に採択されました。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
補ラベル学習の研究を通して、過剰適合の抑制の研究及び弱教師情報を活用した機械学習の研究が進みました。そのため、おおむね順調に進展していると考えています。
|
今後の研究の推進方策 |
来年度も引き続き機械学習における教師情報の工夫や汎化性能・信頼性を高めるための技術の研究を進めていく予定です。
|