Project/Area Number |
23K19974
|
Research Category |
Grant-in-Aid for Research Activity Start-up
|
Allocation Type | Multi-year Fund |
Review Section |
1001:Information science, computer engineering, and related fields
|
Research Institution | Shizuoka University |
Principal Investigator |
野村 祐一郎 静岡大学, 情報学部, 助教 (10980534)
|
Project Period (FY) |
2023-08-31 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
Fiscal Year 2024: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2023: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
|
Keywords | 機械学習 / パターン認識 / ラベルノイズ / 深層学習 / 能動学習 |
Outline of Research at the Start |
クラウドソーシング等の専門知識を必要としないデータ収集技術の発展により、深層学習モデルの学習が容易となった。しかし非専門家によるデータ収集は不正確なため、各訓練データの属性を示すラベルに誤り(ラベルノイズ)が発生し、深層学習の予測性能を低下させる問題がある。そこで本研究は人手による少量のラベル訂正を利用し、深層学習に間違われやすいデータを重点的に識別させる誤差関数を導入する。人と人工知能の相互作用をより効果的に利用することで、深層学習を頑健に訓練する手法の確立を目指す。
|
Outline of Annual Research Achievements |
クラウドソーシング等の専門知識を必要としない技術により収集された大量の訓練データは不正確なため,各訓練データの属性を示す教師信号に誤り(ラベルノイズ)が発生し,深層学習の予測性能を低下させる問題がある.本研究は人と人工知能の相互作用をより効果的に利用して,訓練データセットにラベルノイズがある状況でも深層学習モデルを頑健に訓練する手法の確立を目的とする. 提案手法は深層学習モデルの訓練中に,少量の訓練データに対して人手によるラベル訂正を行うことで効率的にラベルノイズの影響を低減する.具体的には,ラベル訂正の前後情報を利用し,ラベルが訂正されたサンプルを訂正前のラベルの代表的特徴量から陽に区別させる誤差関数を導入する.この手法により,深層学習モデルに注意深く間違われやすい属性のデータの特徴を識別させる. 今年度は,当初の計画通りPCパーツ一式を購入して実験環境を整備し,提案手法の実装及び事前実験の実施を行った.提案手法は大規模画像データを使用して深層学習モデルを訓練するため,高速に計算を処理できるGPUが搭載されたPCを構築した.実験データは既存研究が使用したラベルノイズのある画像データセットCIFAR10HとNoisyCXRを用意し,提案手法へ入力できるようデータの整形を行った.また事前実験として,比較対象であるラベル訂正を行う手法を実装した. また人のラベルに関する知識を活用した研究として,農作物の実画像データに発生したラベルノイズを対象に本研究を発展させた.具体的にはイチゴの実生を撮影した画像から生育の良い個体を選抜する課題において,選抜結果の教師信号にラベルノイズがある場合に人の知識を利用してラベルノイズを訂正する手法を提案した.この研究成果は国内学会で発表する予定である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の予定通り,計算機やデータセット等の実験環境を整備し,少量の訓練データに対して人手によるラベル訂正を行う提案手法を実装した.また事前実験として,比較手法である既存手法の実装も行った.また本研究を発展させた課題として,ラベルノイズのある状況でも生育の良いイチゴの個体を自動で選抜する手法についての研究を実施した.2つの課題ともに,順調に進捗している.
|
Strategy for Future Research Activity |
今年度は人手によるラベル訂正を利用した提案手法を実装できたので,次年度は既存研究との比較実験を実施し,提案手法の有効性を検証する.さらに研究計画調書で述べたデータセット以外のラベルノイズありデータセットを用意し,提案手法をベースに多様なラベルノイズに対しても頑健な手法を開発する.本研究課題の研究課題をまとめ,国際会議や国際論文誌への投稿を目指す.
|