2018 Fiscal Year Research-status Report
映像シーン検索を目的としたコーパスの自動構築と時系列アノテーション法の開発
Project/Area Number |
17K12687
|
Research Institution | Kansai University |
Principal Investigator |
吉田 壮 関西大学, システム理工学部, 助教 (70780584)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 映像検索 / 機械学習 / アノテーション |
Outline of Annual Research Achievements |
本研究では,平成30年度に,1)YouTubeをデータソースとする映像集合からその集合の内容を表す代表的なタグを抽出し,同一タグの内容を含む映像を学習データセットとして構築する手法に着手しアノテーションモデルのアルゴリズム開発,2)構築した映像コーパスを学習データとして利用した識別モデルを構築,識別モデルの出力値を観測することで時系列アノテーションを行いシーンにラベル付けを施す手法の開発に目処を立てることを目指している. 本年度に得られた研究の成果は,以下の通りである.まず,映像特徴に基づいた映像クラスタリングから得られるクラスタから代表的なタグを抽出するアルゴリズムを開発した.この手法は,各クラスタに属する映像タグを,分散表現を用いてベクトル化し,タグ同士の関連性を評価することでクラスタ内で最も中心的なタグを抽出する.本研究では,そのタグをキーワードにした映像検索により同一タグの内容を含む映像を収集することで学習データを構築するが,この時に関連度の低い映像がデータセットに含まれる問題の解決を図った.具体的に平成29年度に開発した映像のリランキング手法に適合性フィードバックを導入した高精度化を実現した.具体的な数値として,前年度と比較して約20%の精度向上を実現した.また,平成30年度では,これまでに構築した映像の学習データセットを利用した映像のアノテーションモデルの構築に着手した.初期検討として,映像全体にアノテーションを施すアルゴリズムを開発した.本アルゴリズムは関連する映像間で同一のタグが付与されているかどうかを投票することでアノテーションの信頼性を向上させる点が新しい.以上までの研究成果は,国内および査読付き国際学会で発表した. 以上より,本研究で目標としてるアノテーションのための学習データの構築部とラベル付与の初期検討を平成30年度におおむね完了したと考えている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は,研究実績の概要で述べた1)YouTubeをデータソースとする映像集合からの映像コーパスの構築,2)構築した映像コーパスを学習データとして利用した映像へのラベル付与法の提案に関しておおむねアルゴリズムの開発・実装と評価をすることができた.1)では,YouTubeから収集した映像の内容を代表的するタグの自動抽出と抽出したタグと関連する映像の高精度な収集,2)では,映像全体へのラベル付けを施すアノテーション手法をそれぞれ提案した.この2)のテーマについては,映像をシーン分割して時系列にアノテーションを行う部分など,未検討の部分があるものの,これらのテーマについての研究は順当に進んでいると考えている.また,得られた成果の一部は,国内および査読付き国際学会で発表した. 2)について未完成な部分が生じた理由として,学習データセットとして用いる映像の収集部において想定よりも高い精度が求められることが分かり,1)のデータ精錬部を再検討し高精度化を図る必要が生じアノテーションモデル構築の検討が遅れたためである.しかし,本年度で平成29年度よりも高い精度を実現したため,研究期間内にこのテーマを進めることが出来ると考えている. 以上の点から,本年度の研究はおおむね順調に進展していると考えている.
|
Strategy for Future Research Activity |
基本的には,研究は順調に推移しているので,当初の計画通り研究を進めることを考えている.すなわち,今年度得られた結果を踏まえて,最終年度に取り組む課題として以下の課題について検討する.1)映像をシーンに分割し,平成30年度までに構築した映像コーパスを学習データとして利用した識別モデルを構築,識別モデルの出力値を観測することで時系列アノテーションを行い,シーンにラベル付けを施す手法を検討する.2)望む映像を素早く探し出すことを可能とする提示法を開発し,これらのアルゴリズムを実装した検索ユーザインタフェースを設計する.
|
Causes of Carryover |
旅費と論文掲載について執行が十分にできていない.研究代表者の論文執筆について,当初予定していたレベルに至らず発表できない状況となり,執行を取りやめた.この分の海外出張費20万程度,雑誌掲載料として15万程度の執行が出来なかった.また,英文校閲費として10万円の執行が翌年度となった.以上から,あわせて45万円程度の執行を出来ず,これが使用額に差異が生じた原因である. 翌年度は,執行できなかった45万円については,雑誌掲載料と英文校閲費としてそれぞれ25万円と20万円を割り当てる.残りは,国内・国際会議に成果を積極的に発表することで研究代表者の旅費として40万円程度の支出を行う.その他の経費としては10万円程度を支出することを考えている.これにより,次年度使用額と配分額を加えた95万3756円を執行する予定である.
|
Research Products
(6 results)