2023 年度研究成果報告書

場の文脈を考慮した異常行動の自動検知

研究課題

PDF

研究課題/領域番号	21H04908
研究種目	基盤研究(A)
配分区分	補助金
応募区分	一般
審査区分	中区分61:人間情報学およびその関連分野
研究機関	国立研究開発法人産業技術総合研究所
研究代表者	原健翔国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (70837575)
研究分担者	青木義満慶應義塾大学, 理工学部(矢上), 教授 (00318792) 金子直史東京電機大学, 未来科学部, 准教授 (40803531) 片岡裕雄国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 上級主任研究員 (70784883)
研究期間 (年度)	2021-04-05 – 2024-03-31
キーワード	深層学習 / 行動認識 / 動画認識 / Transformer / シーングラフ
研究成果の概要	本研究では，動画像における文脈をモデル化し，文脈を考慮した異常検知技術を確立することを目的とし，(a)空間的な文脈のモデル化及び(b)時間的な文脈のモデル化，(c)文脈にとらわれることなく人物行動を表現するモデル，(d)文脈を考慮した異常行動の自動検出アルゴリズムの研究に取り組んだ．昨今の大規模言語モデルの発展により(d)については一定のレベルでの解決が見えてきたこともあり，特に(a)~(c)に注力して研究を進めた結果，シーンの空間的・時間的な文脈を表現するためのシーングラフ構造の検出手法の確立を始めとして，文脈及び人物行動を詳細に表現するためのモデルの構築を進めることができた．
自由記述の分野	コンピュータビジョン
研究成果の学術的意義や社会的意義	近年の研究開発により人工知能技術が急速に進展により視覚的な情報に基づく単純な識別問題は解決されつつある一方で，動画像中の場面や状況を表現する「文脈」を考慮し動画像をより高度に解析することは困難な問題として残っている．本研究では人物と周囲の物体や環境との関係性を捉えることが文脈の表現に重要であることに着目し動画中の文脈の表現を可能とした．これにより，大規模言語モデルの文脈理解能力と組み合わせることで動画中の文脈に従った人物行動の異常検知を可能とし，より高度な動画像解析の実現及び人々の安全・安心を支える基盤技術の構築に貢献した点に学術的・社会的意義がある．