研究課題/領域番号 |
26280040
|
研究機関 | 神戸大学 |
研究代表者 |
上原 邦昭 神戸大学, システム情報学研究科, 教授 (60160206)
|
研究分担者 |
松原 崇 神戸大学, システム情報学研究科, 助教 (70756197)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 機械学習 / 情報検索 / 映像データ / コーパス / 映像検索 / 深層学習 |
研究実績の概要 |
前年度の実績報告書に記載した通り、既に当初の研究テーマ(1. 物体認識の不確実性の定量化、2. 最尤推定に基づく不確実性を考慮した映像検索、3. 映像からの注目領域の検出)の全てについて一定の研究成果を得たため、本年度は、深層学習を用いた高精度な物体認識モデルの構築に取り組んだ。特に、深層学習の中でも、畳み込みとプーリングという2種類の層を交互に積み重ねた畳み込みニューラルネットワーク(CNN: Convolutional Neural Network)を用いた手法に焦点を当てた。これまでに、CNNを用いた高精度な物体認識手法が提案されているが、映像検索に必要な物体の全てがカバーされている訳ではない。言い換えると、多様な検索要求に応じるためには、これまでには対象となっていなかった物体も認識できなければならない。そこで、転移学習の枠組みで、学習済みのCNNを再利用して、映像検索に有用な物体を認識する手法を開発した。概要としては、学習済みのCNNの中間層の出力を入力とする小規模ニューラルネットワーク(microNN: micro Neural Network)を構築する。特に、できる限り多くの学習データを考慮するために、対象物体に対する学習データの入手可能性に応じて、microNNを画像ドメイン、映像ドメイン(フレーム間の時間関係を考慮しない)、映像ドメイン(長短記憶モデル(LSTM: Long-Short Term Memory)を用いて時間関係を考慮する)と段階的に転移させていく手法を開発した。このmicroNNを用いた物体認識に基づく映像検索システムは、米国標準技術局(NIST)主催の国際競争型ワークショップTRECVID 2016のアドホック映像検索(manually-assisted)部門で、参加8チーム中第2位(全22手法中第5位)の検索精度を達成した。
|
現在までの達成度 (段落) |
28年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
28年度が最終年度であるため、記入しない。
|
次年度使用額が生じた理由 |
28年度が最終年度であるため、記入しない。
|
次年度使用額の使用計画 |
28年度が最終年度であるため、記入しない。
|
備考 |
結果概要の13枚目のスライドに、我々の手法が、manually-assistedカテゴリにおいて、参加8チーム中第2位(全22手法中第5位)の検索精度を達成していることが示されている。
|