研究概要 |
平成23年度は,顔画像シーケンス照合の放送映像アーカイブへの適用を行い,顔分類に利用可能なメタデータを抽出・分類した.具体的には,「番組⇔出演者/番組→顔」と「ジャンル⇔出演者/ジャンル⇔顔」に関して重点的に検討を行った.また,抽出される相関関係に基づいてグラフ構造表現を行い,スペクトル・グラフ分割等の解析手法に関する検討を行った.顔のクラスタリングに必要となる顔画像シーケンスの照合に関しては,Local Binary Pattern(LBP)やLocal Phase Quantization(LPQ)などを含む六つの顔画像特徴量を抽出し,Labeled Facesin the Wild(LFW)データベースを実験対象に,複数特徴量間の比較評価を行った.また,顔画像照合は,照明条件,姿勢および表情による特徴量変動が性能に大きく影響するが,Fukunaga-Koontz Transform(FKT)法を顔画像特徴量に適用し,クラス内部におけるサンプルの分散をより小さく持つと同時に,クラス間の分離をより容易にする特徴軸を抽出する特徴選択法を試みた.一方,顔情報構造化を行う際にテレビコマーシャル等の同一映像断片による影響を受ける可能性が考えられ,特にコマーシャル映像を放送映像アーカイブから取り除く必要が高いと認識した.昨年度は,放送映像からテレビコマーシャルを自動的に検出できる二段時間的共起ハッシュ法を提案したが,本年度は,提案手法をマルチメディアストリーム放送へ拡張させると同時に,映像復号化誤差への対処法として同一映像断片間の特徴量変動を抑えるBag-Of-Finger prints(BOFs)モデルを実現した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
記述付加向けの放送映像メタデータの階層的構造化と利用に関しては,やや遅れているが,顔画像照合における特徴量変動の影響回避実験,並びに同一映像断片が顔情報構造化へ与える影響の対処に関しては,当初の計画以上に進展し,上記の状況を総合的に勘案したことによる.
|
今後の研究の推進方策 |
グラフ構造解析による顔情報構造化の性能向上に関しては,従来の顔照合技術に利用された視覚特徴に,より豊富なメタデータ情報を追加・統合する予定であるため,性能向上の実現可能性が大いにあると予測される.性能の向上が当初の計画以下になる場合,外的基準無しの自動的分類から教師有り学習によるクラスタ解析への移行を検討し,問題点に対処する用意がある.
|