Project/Area Number |
22K12169
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 61030:Intelligent informatics-related
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
徳永 旭将 九州工業大学, 大学院情報工学研究院, 准教授 (50614806)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2024: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
Fiscal Year 2023: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2022: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
|
Keywords | 視覚注視機構 / 異常検出 / 画像異常検出 / 外観検査 / 畳み込みニューラルネットワーク / 外観検査AI / ディープニューラルネットワーク / 教師あり学習 / 教師なし学習 / カリキュラム学習 / ディープラーニング / 統計的機械学習 |
Outline of Research at the Start |
近年, 画像の異常検出技術に対して畳み込みニューラルネットワーク (CNN) に立脚した外観検査AI技術が数多く提案されている。しかしながら, CNNの性能を引き出すには, 大規模な訓練データの準備, あるいは類似ドメインで十分な性能を実現できる学習済みCNNが必要である。近年, 物体認識分野で, 判断に必要な情報を選択的に抽出する人間の視覚注視を, CNNの学習に取り入れた, 自己注視という機構が盛んに研究されている。本研究では, 外部駆動型の視覚注視機構を提案する。それにより, 既存の画像認識CNNに対し異常検出性能を大幅に増強することができる統一的な手段の確立を目指す。
|
Outline of Annual Research Achievements |
本研究では、事前に正常画像の再構成を訓練したディーニューラルネットワークの出力から異常度マップを計算し、それを視覚注視機構により教師ありネットワークに導入することで、少ない画像サンプルからでも効果的に異常を検出できる技術の研究を行っている。正常からの乖離度として実際の異常検出に本年度に得られた結果として、外部視覚注視機構で外部より与える異常度マップは、空間的にスパースな性質を持っている方が、異常検出性能の向上に寄与するケースが多いことがわかった。その点を掘り下げ、どのようなケースでどのような空間的スパース性が重要であるかを実験的に調査した。その結果、空間的にスパースな注視マップは、ディープニューラルネットの多くの中間層において、異常検出性能の向上に寄与することが多いことがわかった。逆に、非スパースな注視マップを用いた場合は、最も下位の中間層、ならびに最も上位の中間層(あるいは出力層)において、異常検出性能の向上に寄与することが多いことがわかった。同時に、「過剰な」注視マップは、最も下位ならびに最も上位の中間層(あるいは出力層)以外に注視機構として取り込むと、却って異常検出性能を劣化させることが多いこともわかった。ここまでの結果を査読付きジャーナル論文に投稿し、受理された。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
初年度に査読付き国際会議論文に受理され、次年度に査読付きジャーナル論文に受理されたが、当初の構想以上に興味深い知見が得られており、画像からの異常検出や訓練済みディープラーニングモデルに対するアダプテーション技術として、今後様々な展開が期待できるようになったため。
|
Strategy for Future Research Activity |
本年度に得られた結果により、本研究で研究を進めている外部視覚注視機構は、ディープラーニング以前の特徴点ベースの画像に認識手法と、ディープラーニング以後の表現学習を統合する方法論となり得ると考えている。掘り下げると、外部視覚注視機構は、異常領域の位置情報をディープニューラルネットワークに陽に取り込む機構として応用できると考えられる。一般に、ディープニューラルネットワークでは、位置情報がどのように符号化されるのか未解明の部分があり、目的に応じて制御することは容易ではない。従って、ユーザが意図しない表現で、検出対象物体の位置情報が符号化されてしまう可能性がある。この困難性は、検査対象となる製品が画像上で通常とは異なる位置で置かれている、すなわち位置ずれがあると、異常検出性能が極端に低下することがある。外部視覚注視機構によって、位置情報の符号化プロセスを制御できることができれば、位置づれなどの環境変化に強い異常検出器の構築につながると期待できる。3年次にはその仮説の検証を中心に進める。
|