2017 Fiscal Year Annual Research Report
Research on Automatic Annotation for Video Database Based on Deep Learning
Project/Area Number |
15K00159
|
Research Institution | Kogakuin University |
Principal Investigator |
陳 キュウ 工学院大学, 情報学部(情報工学部), 准教授 (00400292)
|
Co-Investigator(Kenkyū-buntansha) |
小谷 光司 秋田県立大学, システム科学技術学部, 教授 (20250699)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | アノテーション / マルチメディア / データベース / ディープラーニング / アルゴリズム / 情報システム |
Outline of Annual Research Achievements |
近年、情報化社会の急速発展により、伝統的なテレビなどの視聴手段からオンライン動画視聴に変化しつつある。しかし、テレビで放送される映像や、ビデオカメラなどで撮影された映像などには、内容を説明したテキスト情報が存在しない。検索エンジンのように、キーワードなどを用いて簡単に意味に基づいた映像検索を実現するため、映像の内容を表すメタ情報をテキスト形式で付与する自動アノテーション手法が必要である。本研究では、ディープラーニングの方法を取り組み、自動的にビデオアノテーションを高精度かつ高速に実現する手法を試みた。今年度の研究成果は以下のようになる。 本年度は、ビデオデータベースの自動アノテーションシステムを開発し、インターネットを介したPCをベースとしてサーバー・クライアントシステムを構築した。サーバ側では、インターネット上で収集したビデオによるビデオデータベースを構築し、各々のビデオの特徴量の登録を行い、クライアント側から送られたクェリーに対して、ビデオの自動アノテーションを行い、その結果を返信するという仕組みで、前年度研究を行ってきた自動アノテーション技術の動作確認と性能の評価を行った。 また、本研究で行ったシーンの識別手法について、新たにスパースオートエンコーダに基づいた手法を提案した。概要として、フレーム画像から局所的なHOG特徴を抽出し、スパース・オートエンコーダー(sparse autoencoder)によりエンコーディングし、得られたスパース特徴をピラミッドプーリング、及び局所正規化することによってフレーム画像を表現し、より精度の高いシーンの識別を実現できた。
|