研究課題/領域番号 |
21H04908
|
研究種目 |
基盤研究(A)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
中区分61:人間情報学およびその関連分野
|
研究機関 | 国立研究開発法人産業技術総合研究所 |
研究代表者 |
原 健翔 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (70837575)
|
研究分担者 |
青木 義満 慶應義塾大学, 理工学部(矢上), 教授 (00318792)
金子 直史 東京電機大学, 未来科学部, 准教授 (40803531)
片岡 裕雄 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 上級主任研究員 (70784883)
|
研究期間 (年度) |
2021-04-05 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
32,890千円 (直接経費: 25,300千円、間接経費: 7,590千円)
2023年度: 9,230千円 (直接経費: 7,100千円、間接経費: 2,130千円)
2022年度: 10,270千円 (直接経費: 7,900千円、間接経費: 2,370千円)
2021年度: 13,390千円 (直接経費: 10,300千円、間接経費: 3,090千円)
|
キーワード | 深層学習 / 行動認識 / 動画認識 / Transformer / シーングラフ / コンピュータビジョン / 動画像解析 |
研究開始時の研究の概要 |
少子高齢化による労働力不足やWith/After コロナ社会での無人店舗の重要性増加などにより防犯・防災の監視に穴が空きやすい中でも人々の安全・安心を支えていく上では,転倒などの危険や,盗難行動,暴行など,いち早く対応すべき異常をAI により自動的に検出可能とすることが期待される.異常検知を始めとして,動画像をより高度に解析するためには動画像中の場面や状況を表現する「文脈」を考慮することが重要である.そこで本研究では,文脈を考慮した動画像解析技術の確立を目指し,人物行動と文脈を明示的に切り分けてモデル化した後に統合することで場の文脈を考慮した異常行動の自動検知を実現する.
|
研究成果の概要 |
本研究では,動画像における文脈をモデル化し,文脈を考慮した異常検知技術を確立することを目的とし,(a)空間的な文脈のモデル化及び(b)時間的な文脈のモデル化,(c)文脈にとらわれることなく人物行動を表現するモデル,(d)文脈を考慮した異常行動の自動検出アルゴリズムの研究に取り組んだ.昨今の大規模言語モデルの発展により(d)については一定のレベルでの解決が見えてきたこともあり,特に(a)~(c)に注力して研究を進めた結果,シーンの空間的・時間的な文脈を表現するためのシーングラフ構造の検出手法の確立を始めとして,文脈及び人物行動を詳細に表現するためのモデルの構築を進めることができた.
|
研究成果の学術的意義や社会的意義 |
近年の研究開発により人工知能技術が急速に進展により視覚的な情報に基づく単純な識別問題は解決されつつある一方で,動画像中の場面や状況を表現する「文脈」を考慮し動画像をより高度に解析することは困難な問題として残っている.本研究では人物と周囲の物体や環境との関係性を捉えることが文脈の表現に重要であることに着目し動画中の文脈の表現を可能とした.これにより,大規模言語モデルの文脈理解能力と組み合わせることで動画中の文脈に従った人物行動の異常検知を可能とし,より高度な動画像解析の実現及び人々の安全・安心を支える基盤技術の構築に貢献した点に学術的・社会的意義がある.
|