2006 Fiscal Year Annual Research Report
非定常音源モデルに基づく高品位音声合成システムの開発
Project/Area Number |
18700171
|
Research Institution | Kanazawa University |
Principal Investigator |
野村 英之 金沢大学, 自然科学研究科, 助手 (90334763)
|
Keywords | 非定常声門流れ / 声帯音源 / 気息性雑音 / ゆらぎ / 変動係数 / HNR |
Research Abstract |
本年度は,非定常音源のモデル化に関して,以下の3点の検討を行った. 1.振動しない声帯モデルにおける非定常声門流れに起因する雑音源の数値解析:声帯を剛体とした数値声門モデルにおける声門流れの数値シミュレーションを行った.声門流れの非定常化により,声門での気息性ノイズの発生,及び声門下流における渦に起因する圧力変動が確認された.さらに,これらの音源に,仮声帯の影響を調べた.その結果,仮声帯の存在はノイズの振幅を増強させ,さらにそのスペクトルを広帯域かさせることを示した. 2.非定常声門流れの効果を考慮した,声帯音源数値モデルの構築:1で見られた非定常声門流れが音声生成に与える影響を検討するため,声帯音源数値モデルの構築を行った.このモデルを用いた数値実験から,声帯振動の基本的な特徴を計測した.結果はこれまでに得られている,摘出喉頭などによる実測データと一致し,その有効性が確認された. 3.音声に含まれる非定常成分の解析:実際の音声に含まれる揺らぎの解析を行った.揺らぎとしてピッチ周波数,振幅,波形の3種類を対象とした.ピッチ周波数,及び振幅は変動係数CVで,波形に関してはHNR(Harmonic-to-Noise Ratio)で評価を行った.対称データは母音の定常部分とした.その結果,ピッチ,及び振幅についてはCVが数%程度の変動であった.波形に関してはHNRが20dB程度であった.これらの値は2の数値シミュレーションで得られたデータとほぼ一致した. 今回の数値シミュレーションは健常者をモデル化したにもかかわらず,得られたデータには揺らぎ成分が観測された.このことは,健常者を対象とした通常の音声の合成においても,何らかの揺らぎ成分を付加することが有効であることを示唆する結果である.
|