研究課題/領域番号 |
26730090
|
研究機関 | 大阪大学 |
研究代表者 |
中村 和晃 大阪大学, 工学(系)研究科(研究院), 助教 (10584047)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 視覚メディア処理 / 視覚概念学習 |
研究実績の概要 |
本課題の研究目的は,大規模なタグ付き映像データセットを利用して動詞的概念(動詞により表現される概念)の視覚モデルを構築することである.この目的の達成に際しては,映像に付与されたタグが映像中のどのシーンに対応するのかが一般に不明である(以下これを「タグ・シーン対応の不完全性」と呼ぶ),という点が問題となる.この問題の解決のため,本課題では次の三つのテーマをサブテーマとして掲げ,これらへの検討を通して上記の目的の達成を図ることとした. (A)名詞的概念に基づくシーン表現およびシーン間類似度算出 (B)共通タグを持つ映像群からの類似シーン抽出によるタグとシーンの対応付け (C)多数のタグ・シーン対応関係を利用した統計的学習による動詞的概念の視覚モデル化 平成26年度は主としてテーマ(A)に着手し,名詞的概念(名詞により表現される概念)に基づくシーン表現ならびにシーン間類似度算出のための基礎的な手法を開発した.この手法では,映像(シーン)からの名詞的概念の抽出に際して,大規模なタグ付き画像データセットを利用して名詞的概念の視覚モデルを構築し,そのモデルを当該映像に適用することでこれを実現した.また,テーマ(C)のための準備として,タグ・シーン間の完全な対応関係が得られているという条件の下で動詞的概念の視覚モデルを構築する手法を検討・開発し,その有効性を,既存のベンチマークデータセットを対象とした実験により実証した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の計画において平成26年度に着手予定であったテーマは,概要の欄で述べた(A)~(C)のうちテーマ(A)のみである.このテーマ(A)については,これまでの研究により,名詞的概念に基づくシーン表現ならびにシーン間類似度算出のための手法を実際に開発する段階にまで至った.論文等の形で対外発表する段階にこそ至っていないものの,口頭発表の予定は既に確定していることから,研究の進捗はおおむね順調であると考えている. また,当初は計画していなかったテーマ(C)についても予備的な検討を実施した.その成果は,国際会議で発表することが既に予定されている.このことからも,研究の進捗は概ね順調である.
|
今後の研究の推進方策 |
平成26年度にテーマ(A)を通して開発したシーン間類似度算出手法には改善の余地が多々ある.具体的な例として,シーンを名詞的概念の重み付き集合として表現する際の「重み」の設定,重み付き集合同士の類似度を算出する際のメトリックの検討,最適なメトリックを自律的に学習するための学習手法の構築などが挙げられる.今後は,これらの点について特に重点的に検討し,シーン間類似度算出手法の妥当性の向上に努める. また,当初の計画において着手予定であったテーマ(B)に着手する.テーマ(B)の内容は,同種の物体を撮影した複数枚の画像からその物体の領域を相互に抽出する処理であるImage Cosegmentationとの関連性が深い.そこで,Image Cosegmentationの分野について最新の手法を調査し,それらの手法を映像に適用できる形に拡張することを検討する.
|
次年度使用額が生じた理由 |
当初の計画では,画像の収集・解析ならびに映像の収集・解析を目的としてPCを複数台購入する予定であったが,実際には,本研究課題とは異なる過去の研究において使用したPCを上記の目的で流用することができた.これらの流用PCは元々画像・映像の解析に用いることを想定したものではなかったため,データの蓄積に伴って性能面で不足が目立つようになり,最終的には新たなPCを1台購入することとなったが,それでも当初の予定よりは購入台数が減ったため,次年度使用額が生じた.
|
次年度使用額の使用計画 |
平成26年度の研究を通して,画像・映像の解析においては,収集した画像・映像データだけでなく中間処理結果のデータも保存することが望ましいと考えるに至った.このためには,当初の予定よりも多量の外部記憶装置(ハードディスク,DVD-Rなど)が必要となる.そこで,今年度生じた次年度使用額の使途としては,外部記憶装置の追加購入を想定している.
|