2001 年度実績報告書

話し方および顔表情における個人特性の認識・合成システムに関する研究

研究課題

研究課題/領域番号	11680402
研究機関	立命館大学
研究代表者	小川均立命館大学, 理工学部, 教授 (40116009)
キーワード	音声合成 / 顔表情 / 擬人化エージェント / 基本周波数制御
研究概要	擬人化エージェントの実現に必要な基盤技術として,自然な顔表情と顔に見合った人間らしい話し言葉の音声合成を行うためにつぎの研究を行った. 1.自然な顔表情を実現するための三次元顔モデルを作成し,画像で与えられた顔を自由に変形し,表情を作成するシステムを開発した.表情を実現するためにFACS(Facial Action Coding System)を利用し,それぞれのAU(Action Unit)の動作範囲について,表示実験により決定した.また,合成音に合わせた自然なリップシンクロナイゼーションを効率よく実現するために,日本語発話における口の形を分類し,9種類の口の形状で十分であることを確かめた. 2.言語情報と非言語情報によって基本周波数を制御する手法の開発を行うと共に,発話の基本周波数パターンを調べるためつぎの2種類の方法について検討を行った. (1)本研究では,基本周波数制御に関して入力パラメータが1つのモデルを提案している.このため,発話の基本周波数を逆変換することが可能であるため,各人の基本周波数における個性的な発話を実現できることが判明した.また,従来のABS(Analysis by Synthesis)による基本周波数推定法よりも効率よく制御パラメータ値が得られることも分かった. (2)基本周波数の文章における変化パターンについて,離散フレーズの考え方を用いて計測する方法を提案し,実験により有効性を確かめた.これにより,方言や目的に特化した話し方それぞれに対して,基本周波数の特徴が得られることが分かった.

研究成果
(3件)

すべてその他

すべて文献書誌 (3件)

[文献書誌] 豊田悟史, 森山高明, 小川均: "離散フレーズパターンを用いた朗読発話の基本周波数生成手法"日本音響学会講演論文集. 2-6-13. 307-308 (2001)
[文献書誌] 豊田悟史, 森山高明, 小川均: "話者の発話特徴を反映したDMPパターンによる合成音声器"信学技法. SP2001-114. 1-8 (2002)
[文献書誌] 官上大輔, 小川均: "情報端末を用いた周辺機器操作支援システム"信学技法. SST2001-155. 197-204 (2002)