Research Abstract |
本年度は,トップダウン知識を導入して,ボトムアップ処理の構造化結果に意味付けを与える手法について検討した.対象としては,野球の映像を取り上げた.野球の映像では,1プレイが開始される際に,ほとんどの場合センターバックスクリーンに設置したカメラで撮影した映像が放送される.この映像を含むショットのことを,プレイ開始ショットとよぶ.プレイ開始ショットは,映像中から1プレイの映像区間を抽出し構造化する上で,非常によい目印となる.そこで,まず,ボトムアップ処理により,このプレイ開始ショットを自動抽出した. プレイ開始ショットは,互いに非常に類似しており,かつ,スポーツの試合が1プレイの繰り返しからなることから,映像中に多数現れるという特徴をもつ.このことを利用して,映像をショットに分割し,各ショットの特徴量を計算する.特徴量空間で,多数のショットが密集した部分を検出し,そこに含まれるショットを,プレイ開始ショットとした.ショットの分割には,昨年度開発した,ショット検出手法を利用した. 次に,1プレイより上位の階層を抽出し,意味付けを与えた.ここでは,野球の試合がもつ意味的なまとまりである「イニング」を対象とした.「イニング」の違いは,攻守の切替えであり,映像上では,プレイ開始ショットにおける,各チームの選手の位置の変化として捉えられる.そこで,抽出したプレイ開始ショットを,映像のフレーム内の位置に基づきブロック状に細分化し,各ブロック毎に細かく分類を行った,この際,攻守の違いに関係するブロックと特に意味をなさないブロックが存在するため,それらを自動的に判別し,「イニング」に対応する分類のみを採用する手法を導入した. この手法により,1プレイ単位の構造化の再現率/適合率は99.3%/79.5%,1イニング単位では,100%/64.7%の結果を得た.このように,試合構造におけるイニングの違いと,映像上の変化の関係をトップダウン知識として与えることにより,映像の構造化がより正確に行えるようになった.同様の手法を,テニス,バレーボール,アメリカンフットボール,バドミントンの映像にも適用し,効果を確認した.
|