研究課題/領域番号 |
23K19974
|
研究機関 | 静岡大学 |
研究代表者 |
野村 祐一郎 静岡大学, 情報学部, 助教 (10980534)
|
研究期間 (年度) |
2023-08-31 – 2025-03-31
|
キーワード | 機械学習 / パターン認識 / ラベルノイズ / 深層学習 |
研究実績の概要 |
クラウドソーシング等の専門知識を必要としない技術により収集された大量の訓練データは不正確なため,各訓練データの属性を示す教師信号に誤り(ラベルノイズ)が発生し,深層学習の予測性能を低下させる問題がある.本研究は人と人工知能の相互作用をより効果的に利用して,訓練データセットにラベルノイズがある状況でも深層学習モデルを頑健に訓練する手法の確立を目的とする. 提案手法は深層学習モデルの訓練中に,少量の訓練データに対して人手によるラベル訂正を行うことで効率的にラベルノイズの影響を低減する.具体的には,ラベル訂正の前後情報を利用し,ラベルが訂正されたサンプルを訂正前のラベルの代表的特徴量から陽に区別させる誤差関数を導入する.この手法により,深層学習モデルに注意深く間違われやすい属性のデータの特徴を識別させる. 今年度は,当初の計画通りPCパーツ一式を購入して実験環境を整備し,提案手法の実装及び事前実験の実施を行った.提案手法は大規模画像データを使用して深層学習モデルを訓練するため,高速に計算を処理できるGPUが搭載されたPCを構築した.実験データは既存研究が使用したラベルノイズのある画像データセットCIFAR10HとNoisyCXRを用意し,提案手法へ入力できるようデータの整形を行った.また事前実験として,比較対象であるラベル訂正を行う手法を実装した. また人のラベルに関する知識を活用した研究として,農作物の実画像データに発生したラベルノイズを対象に本研究を発展させた.具体的にはイチゴの実生を撮影した画像から生育の良い個体を選抜する課題において,選抜結果の教師信号にラベルノイズがある場合に人の知識を利用してラベルノイズを訂正する手法を提案した.この研究成果は国内学会で発表する予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の予定通り,計算機やデータセット等の実験環境を整備し,少量の訓練データに対して人手によるラベル訂正を行う提案手法を実装した.また事前実験として,比較手法である既存手法の実装も行った.また本研究を発展させた課題として,ラベルノイズのある状況でも生育の良いイチゴの個体を自動で選抜する手法についての研究を実施した.2つの課題ともに,順調に進捗している.
|
今後の研究の推進方策 |
今年度は人手によるラベル訂正を利用した提案手法を実装できたので,次年度は既存研究との比較実験を実施し,提案手法の有効性を検証する.さらに研究計画調書で述べたデータセット以外のラベルノイズありデータセットを用意し,提案手法をベースに多様なラベルノイズに対しても頑健な手法を開発する.本研究課題の研究課題をまとめ,国際会議や国際論文誌への投稿を目指す.
|
次年度使用額が生じた理由 |
実験に関連した雑務が発生した場合に備え人件費,謝金を用意していたが使用する機会がなかった.また実際に購入した物品等の価格が想定していたよりも安かったため,次年度使用額が発生した.今後は次年度使用額を利用してメモリなどのPCパーツを購入し,実験を行う環境を増強する.また実験終了後に研究成果を発表する場として国内会議・国際論文誌への投稿を目指しているため,旅費及び参加費に利用する予定である.
|