本研究では動画像の撮影状況を携帯テレビ電話に限定し、話者を抽出することに特化した高速アルゴリズムを開発した。具体的には携帯の動画配信で主流となっているQCIF(176x144画素)15フレーム/秒の実時間処理を目標とする。 本年度は具体的には以下のステップにより研究開発を推進した。 1)肌色情報、位置情報を利用した高速顔オブジェクト抽出アルゴリズムの開発 対象が携帯電話の話者であるため、その顔オブジェクトの位置や肌色情報は限定可能でありかつ変化が少ない。それらを利用することにより、オブジェクト抽出に必要となるパラメータ抽出の高速化・高精度化を行った。 2)テクスチャ質感、顔オブジェクトとの相関等を利用した、頭部オブジェクト抽出アルゴリズムの開発 頭部のテクスチャ質感は顔や背景に比べ均一である傾向がある。それらを利用した高速頭部オブジェクト抽出アルゴリズムを開発した。 3)上記オブジェクトとの相関、動き情報、位置情報等を利用した人物オブジェクト抽出アルゴリズムの開発 上記のアルゴリズムで得られた位置情報や各種パラメータを再利用することにより、高速人物オブジェクト抽出アルゴリズムを開発した。
|