2016 Fiscal Year Annual Research Report
Development of video retrieval engine by using a large-scale video corpus
Project/Area Number |
26280040
|
Research Institution | Kobe University |
Principal Investigator |
上原 邦昭 神戸大学, システム情報学研究科, 教授 (60160206)
|
Co-Investigator(Kenkyū-buntansha) |
松原 崇 神戸大学, システム情報学研究科, 助教 (70756197)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 機械学習 / 情報検索 / 映像データ / コーパス / 映像検索 / 深層学習 |
Outline of Annual Research Achievements |
前年度の実績報告書に記載した通り、既に当初の研究テーマ(1. 物体認識の不確実性の定量化、2. 最尤推定に基づく不確実性を考慮した映像検索、3. 映像からの注目領域の検出)の全てについて一定の研究成果を得たため、本年度は、深層学習を用いた高精度な物体認識モデルの構築に取り組んだ。特に、深層学習の中でも、畳み込みとプーリングという2種類の層を交互に積み重ねた畳み込みニューラルネットワーク(CNN: Convolutional Neural Network)を用いた手法に焦点を当てた。これまでに、CNNを用いた高精度な物体認識手法が提案されているが、映像検索に必要な物体の全てがカバーされている訳ではない。言い換えると、多様な検索要求に応じるためには、これまでには対象となっていなかった物体も認識できなければならない。そこで、転移学習の枠組みで、学習済みのCNNを再利用して、映像検索に有用な物体を認識する手法を開発した。概要としては、学習済みのCNNの中間層の出力を入力とする小規模ニューラルネットワーク(microNN: micro Neural Network)を構築する。特に、できる限り多くの学習データを考慮するために、対象物体に対する学習データの入手可能性に応じて、microNNを画像ドメイン、映像ドメイン(フレーム間の時間関係を考慮しない)、映像ドメイン(長短記憶モデル(LSTM: Long-Short Term Memory)を用いて時間関係を考慮する)と段階的に転移させていく手法を開発した。このmicroNNを用いた物体認識に基づく映像検索システムは、米国標準技術局(NIST)主催の国際競争型ワークショップTRECVID 2016のアドホック映像検索(manually-assisted)部門で、参加8チーム中第2位(全22手法中第5位)の検索精度を達成した。
|
Research Progress Status |
28年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
28年度が最終年度であるため、記入しない。
|
Causes of Carryover |
28年度が最終年度であるため、記入しない。
|
Expenditure Plan for Carryover Budget |
28年度が最終年度であるため、記入しない。
|
Remarks |
結果概要の13枚目のスライドに、我々の手法が、manually-assistedカテゴリにおいて、参加8チーム中第2位(全22手法中第5位)の検索精度を達成していることが示されている。
|
Research Products
(12 results)
-
-
-
-
-
[Presentation] Convoy Detection in Crowded Surveillance Videos2016
Author(s)
Zeyd Boukhers, Yicon Wang, Kimiaki Shirahama, Kuniaki Uehara and Marcin Grzegorzek
Organizer
7th International Workshop on Human Behavior Understanding
Place of Presentation
University of Amsterdam (Amsterdam, The Netherlands)
Year and Date
2016-10-16
Int'l Joint Research
-
-
-
-
-
-
-