2019 Fiscal Year Research-status Report
少数の画像・音声データに基づく特定害獣検出のための特徴抽出と人工学習データの生成
Project/Area Number |
19K12040
|
Research Institution | Tokyo University of Agriculture and Technology |
Principal Investigator |
堀田 政二 東京農工大学, 工学(系)研究科(研究院), 准教授 (90346932)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | パターン認識 / 特徴抽出 / 音声フィルタ |
Outline of Annual Research Achievements |
本研究では,害獣に関する音声や画像データが手元に少数しかなくても高精度に害獣を検出および認識できるように,害獣に特化した特徴設計と学習データの人工的な生成方法を確立することを目的としている.2019年度では,音声に関する害獣に特化した特徴量の設計を実施した.具体的には,MFCCの特徴抽出におけるメルフィルタバンクの分布を,Adaboostを利用した顔検出におけるHaar-like特徴と同様に,さまざまにフィルタの形状,位置,幅を総当り的に変えていき,そのたびに当該害獣の検出精度を算出して,最も検出精度の高くなる組み合わせを求めるアプローチにより自動的に設定できるようにした.このフィルタの設計法はあらゆる生物に対して応用可能な汎用的な手法である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
特定の害獣に対する音声検出の精度が,当初の目標値であるF値0.9を上回ることが実験的に示されたため,現在のところ大きな問題は無いが,COVIDの影響により現地での実運用に関する調査を行えていないため,この点に関しては目標未達である.そのためおおむね順調に進展していると判断した.
|
Strategy for Future Research Activity |
今年度より,学習データが少ない場合に対して,特徴抽出とは別の有用なアプローチとして人工的に学習データを生成し,それを検出・認識モデルに利用する方法に取り掛かる.具体的には,はじめに線形結合により人工データを生成し,それを深層学習の一種である敵対的生成ネットワーク(GAN)の学習データとして利用することで,複雑な分布形状を持つデータ集合を生成することを試みる.
|