研究課題
基盤研究(B)
動画コンテンツにおいて描写されている人間の動作・行為に対して,その意味を考慮した適切な注釈付けを行うことができれば,高度な動画検索システムを実現したり,動画から有用な知識情報を計算機が利用可能な形で抽出することが可能となる.本研究では,そのための基盤技術として,フレーム画像の内容を離散的構造として抽出するためのシーングラフ生成法,および,自然言語表現として得るための動作キャプション生成法の研究を進め,比較手法を上回る精度を達成した.また,関連する画像・言語解析技術の基礎研究を推進し,その成果を論文として発表した.
動画コンテンツは継続的に増加しており,これらのコンテンツに対する高度なアクセス手段の提供や,コンテンツから有用な情報や知識を抽出機能が求められている.本研究の成果は,このような機能・システムを実現するための基盤技術として活用することが可能である.開発した技術は,映像・画像情報と言語情報を統合的に利用するものであり,マルチメディア・マルチモーダル情報処理技術の高度化に寄与しうる.
すべて 2022 2021 2020 2019 2018 2017
すべて 雑誌論文 (5件) (うち査読あり 3件、 オープンアクセス 3件) 学会発表 (84件) (うち国際学会 33件、 招待講演 2件) 図書 (4件)
Arxiv
巻: arXiv:2203.04218 ページ: 1-8
IEEE Robotics and Automation Letters
巻: 6 号: 2 ページ: 4225-4232
10.1109/lra.2021.3067862
精密工学会誌
巻: 84 号: 12 ページ: 983-990
10.2493/jjspe.84.983
130007534741
人工知能学会論文誌
巻: 33 号: 1 ページ: DSH-C_1-24
10.1527/tjsai.DSH-C
130006588889
人工知能学会誌
巻: 32