研究課題/領域番号 |
23K28146
|
補助金の研究課題番号 |
23H03456 (2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2023) |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
小区分60030:統計科学関連
合同審査対象区分:小区分60030:統計科学関連、小区分61030:知能情報学関連
|
研究機関 | 大阪大学 |
研究代表者 |
原 聡 大阪大学, 産業科学研究所, 准教授 (40780721)
|
研究分担者 |
松井 孝太 名古屋大学, 医学系研究科, 講師 (50737111)
|
研究期間 (年度) |
2023-04-01 – 2028-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
17,420千円 (直接経費: 13,400千円、間接経費: 4,020千円)
2027年度: 3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
2026年度: 3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
2025年度: 5,720千円 (直接経費: 4,400千円、間接経費: 1,320千円)
2024年度: 3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
2023年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
|
キーワード | 機械学習 / 能動学習 / 能動的評価 |
研究開始時の研究の概要 |
スモールデータへ機械学習を適用するためには、スモールデータでモデルが学習できることに加えてモデルの性能が評価できることが必須である。しかし、データの数が限られるスモールデータ問題では、必然的に評価に使えるラベル付きデータの数も限られ適切な性能評価は困難である。本研究ではこの課題解決のためにモデルの性能評価に有用なデータを選んでラベルを付与する「能動的モデル評価」技術の研究に取り組む。
|
研究実績の概要 |
スモールデータへ機械学習を適用するためには、スモールデータでモデルが学習できることに加えてモデルの性能が評価できることが必須である。しかし、データの数が限られるスモールデータ問題では、必然的に評価に使えるラベル付きデータの数も限られ適切な性能評価は困難である。本研究プロジェクトではこの課題解決のためにモデルの性能評価に有用なデータを選んでラベルを付与する「能動的モデル評価」技術の研究に取り組む。そして開発した「能動的モデル評価」の方法を医療や材料探索など実問題に適用しそのの有効性を検証する。
本研究の最初の課題「(課題 1)最小限の情報(ラベルなしデータ及び教師オラクル)の利用」の研究に取り組んだ。 この課題について大きく2つの成果が得られた。1つ目の成果では、[Kossen+, ICML'21]の方法を拡張することで、能動的な複数モデルの性能評価(モデル選択)を実現した。この成果により、複数のモデルの中から最も少ないモデルを省コストで推定することが可能となった。2つ目の成果では、能動的モデル評価を能動学習の問題へと帰着する方法を考案した。具体的には二値分類問題の誤分類率の能動的評価の問題が、能動学習の一種であるレベル集合推定の問題に帰着できることを明らかにした。この帰着により、既存の能動学習の方法論を能動的モデル評価へと活用できるようになり、より効果的な技術開発ができると期待できる。これらの成果を国内学会(人工知能学会全国大会、IBISML研究会、IBIS)および国際ワークショップ(NeurIPS 2023 Workshop on Adaptive Experimental Design and Active Learning in the Real World)にて発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初計画において、最初の課題「(課題 1)最小限の情報(ラベルなしデータ及び教師オラクル)の利用」の研究に対して、(i) [Kossen+, ICML'21]の方法を基盤に発展させること、そして (ii) 能動的モデル評価を能動学習の問題へと帰着する方法について検討することを予定していた。 これら(i), (ii)のそれぞれについて予定通りに新たな成果をあげることができた。
|
今後の研究の推進方策 |
当初の研究計画通りに順調に研究が進んでいる。 今年度の研究成果を国際会議や学術雑誌に投稿するとともに、計画通りに研究をさらに発展させていく。
|