研究概要 |
本研究で新たに開発したオプティカル・スネ-クは、動的輪郭抽出法(スネ-ク)の初期輪郭を、直前の画像に対するスネ-クの結果得られた各点の座標値と、2つの画像から求められるオプティカル・フローとにより決定する。この協調処理によって、スネ-クのみによる輪郭抽出よりロバストで、オプティカルフローのみの処理より正確な輪郭抽出が可能となった。具体的には、まずCCDカメラから顔画像(1秒間に30フレーム)をビデオディスクアレイに取り込み、すべての画像に対して1フレーム前の画像とのオプティカルフローを求める。次に、オペレータが1枚目の画像に対してのみ口唇を取り巻くようにスネ-クの初期輪郭をマウスを使ってディスプレイ上で与える。オプティカル・スネ-クは、与えられた初期輪郭をもとに1枚目の口唇の輪郭を抽出する。2枚目以降は、直前の画像の口唇輪郭とオプティカル・フローからその画像での初期輪郭を求め、スネ-クにより口唇輪郭を順次抽出する。以上の結果として各フレームでの正確な口唇輪郭を構成する点群の座標が得られた。つぎに複数の被験者に/a/,/i/,/u/,/e/,/o/を連続的に発声してもらい、オプティカル・スネ-クによって精度良く抽出された結果を統計的に解析した。その結果、唇の上部、すなわち上唇の動きとその速度が下唇の動きと比較して非常に小さいことが分った。さらに、オプティカル・スネ-クを用いていくつかの口唇運動を光造形システムを用いて3次元形状化した。この造形物は、画面上で見る口唇運動よりも発話者の特徴を把握しやすいことが明らかとなった。
|