2004 Fiscal Year Annual Research Report
日本語音声発話における動的口形素の作成に関する研究
Project/Area Number |
14580431
|
Research Institution | Kanazawa Institute of Technology |
Principal Investigator |
平山 亮 金沢工業大学, 情報フロンティア学部, 助教授 (70329374)
|
Keywords | 日本語 / viseme / 口形素 / アニメーション / 発話運動 / マルチメディアデータベース / 口唇 / MPEG-4 |
Research Abstract |
日本語音韻に対応した正確な口唇アニメーションを行うことを目的とし、日本語短文を発話している被験者の口唇周辺の運動を高速ビデオカメラで記録し、同時に音声を録音する実験を一昨年度、昨年度に引き続き行った。今年度は特に、追加の被験者、240コマ/秒・256×256画素といった追加の実験条件により計測し、データを充実させた。口唇に青色口紅の色をつけて動作の解析を容易にしたデータの収集も行った。収集したデータについては、無音部など不要な部分のデータを除くなどの基本的データ処理を行って、動画像データベースとしてデータベース化した。 データベース化した口唇周辺動画像データの詳細な分析を継続し、口形素の抽出を行った。又、発話するのに形状だけでなく動きが必要な音韻、例えば、破裂音/ba/などについて、高速記録の特性を生かし、詳細な観察を行った。詳細に観察したデータから、発話音韻に対応した、典型的な口唇形状、すなわち、口形素の抽出を行い、MPEG-4のボディパラメータに準じる口唇上の点の座標データの形で記録し、その座標データを用いて、コンピュータグラフィックス(CG)による口唇モデルによる口形素モデルを作成した。口形素CGモデルを時間軸上に離散的に配置し、線形補間、重み付き補間、ラスター画像レベルでの補間などにより中間を補間したキーフレームアニメーションを行った。これにより、従来典型的に行われていた発話アニメーションに比較して、より実際のヒトの動きに近い発話時口唇運動アニメーションが可能となった。
|