研究概要 |
従来,音声の個人性知覚に関して様々な物理量の寄与が指摘されているが,個人性を表わすために必要十分な物理量のリストは解明されていない.本研究では個人間の差異ではなく類似性に着目することによって,この問題の解決を試みた.つまり,個人性が似ている2人の音声を分析し,2人の間で値が近い物理量を抽出すれば,個人性知覚に本質的な物理量が特定できる.逆に,この2人の間で値が大きく異なる物理量は個人性知覚にとって本質的ではないといえる.この考えにもとついて個人性の類似度知覚の要因となる物理量を特定する検討を進め,さらに個人性の再現性を高めた音声合成システムの開発を行った. 昨年度までの検討によって,音声の個人性が類似する2話者においては,音声スペクトルの高周波数成分が類似していることが明らかになった.そこで,本年度は音声スペクトルの高周波数成分の個人差に寄与する喉頭腔(声道の声門付近の細い管状の部位)の音響特性について調査した.声道の等価回路モデルを用いたシミュレーションによって,喉頭腔の形状は音声スペクトルの第4ホルマント周波数を決定づけることが明らかになった.さらに,喉頭腔において生じる共鳴(喉頭腔共鳴,第4ホルマントに対応する)は,有声発話時の声門閉鎖区間においてのみ発生し,声門開放区間においては消失することを明らかにした.このことは,シミュレーションのみならず,実音声の帯域フィルタ分析によっても示された. さらに,上記のような喉頭腔共鳴の特性を組み込むことによって,個人性の再現性を高めた音声合成システムを開発した.この音声合成システムはMaeda(1982)にもとづくもので,人間の発話のメカニズムを模倣して時間領域で音声を合成する.このシステムに喉頭腔を含む声道下部の音響特性を正確に反映させる機能を追加し,さらに声帯音源特性を制御することによって,Maeda(1982)やその他の音声合成方式と比較して個人性の再現性の高い合成音声が得られることを示した.
|