2016 Fiscal Year Research-status Report
ディープラーニングを用いたビデオデータベースの自動アノテーションに関する研究
Project/Area Number |
15K00159
|
Research Institution | Kogakuin University |
Principal Investigator |
陳 キュウ 工学院大学, 情報学部(情報工学部), 准教授 (00400292)
|
Co-Investigator(Kenkyū-buntansha) |
小谷 光司 東北大学, 工学研究科, 准教授 (20250699)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | アノテーション / マルチメディア / データベース / ディープラーニング / アルゴリズム / 情報システム |
Outline of Annual Research Achievements |
近年、ネットワック接続速度の向上および大容量ストレージ装置の価格が下落に伴い、インターネット上で公開されるデジタルコンテンツの数が急速に膨らんでいる。テレビで放送される映像や、ビデオカメラなどで撮影された映像などには、内容を説明したテキスト情報が存在しないため、キーワードなどを用いて簡単に意味に基づいた映像検索を実現するのに、映像内容を表すメタ情報をテキスト形式で付与する自動アノテーションが必要である。本研究ではディープラーニングの方法を取り組み、自動的にビデオアノテーションを高精度かつ高速に実現する手法を試みた。今年度の研究成果は以下のようになる。 まず各種ビデオのフォーマットに対応する技術開発を行った。MPEGデータフォーマットのDC画像に畳み込みニューラルネットワーク(CNN)を適用することで、完全なMPEGデコードを実行することなく圧縮データから直接扱うことができた。また、フレームレート、フレームサイズの変化などビデオの編集による影響を対応できる手法を検討した。ヒストグラム上での正規化によるヒストグラム同士の時間窓内の特徴ベクトル数の同じにすることで、フレームレートの変化の影響を低減させた。 また、新たに提案する「方向ベクトル特徴量」を用いた高速探索を試みた。方向ベクトル特徴量を既存の特徴量と組み合わせることで映像の探索精度が向上することを示した。また、時系列アクティブ探索の適用により、無駄な照合を削減することで探索の高速化ができた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
現在までは当初の予定通り、各種ビデオのフォーマットに対応する技術開発を行い、また、フレームレート、フレームサイズの変化などビデオの編集による影響を対応できる手法を確立した。共同研究者と定期的研究の打ち合わせを行っており、良好な連携が取れていた。研究実施体制が当初に計画した体制を組めた。
|
Strategy for Future Research Activity |
これからの研究は当初の予定通りで、ビデオデータベースの自動アノテーションシステムを開発し、インターネットを介したPCをベースとしてサーバー・クライアントシステムを構築する。ここまでの自動アノテーション技術の動作確認と性能の評価を行うなどの研究へ展開する。また、共同研究者と定期的研究の打ち合わせなどを行い、研究実施体制を維持する予定である。
|
Causes of Carryover |
次年度使用額が生じた理由としては、ビデオアノテーション評価装置を試作のために用いる機材類の納品遅延により、支払いは次年度にずれ込むことになった。
|
Expenditure Plan for Carryover Budget |
前年度未使用額と平成29年度助成金を合わせて、評価用機材類を購入し、評価装置を試作し、動作確認と性能の評価を行う。
|