1997 Fiscal Year Annual Research Report
Project/Area Number |
08680386
|
Research Institution | Utsunomiya University |
Principal Investigator |
粕谷 英樹 宇都宮大学, 工学部, 教授 (20006240)
|
Co-Investigator(Kenkyū-buntansha) |
楊 長盛 宇都宮大学, 工学部, 助手 (80272219)
|
Keywords | 音声合成 / 声質 / 個人性 / ARX分析 / フォルマント / 音源特徴 / 嗄声 / ささやき |
Research Abstract |
われわれの目指す柔軟な声質制御とは、ささやき、気息性、緊張性などのいわゆる狭義の声質と話者の音声器官の生理学的違いに起因する個人性を多様に制御することであり、本研究課題の目的はそのための音声合成方式の基礎を確立することである。本年度は昨年度に開発した時変ARX(Autoregressive with exogeneous input)音声分析法を用いて、国際音声学会議が制定した「ささやき(whisper)、気息性(breathy)、ざらざら声(harsh)」に、緊張性(tense)を加えた声質の制御法について詳細に検討した。 ささやきについては、昨年度考案した制御法の根拠になる音響理論について詳細に検討し、MR画像や電子内視鏡による発声中の喉頭の挙動に関する計測と音響シミュレーションを行って、従来の定説とは異なる新しい機構を見出した。気息性については、喉頭雑音の強度並びに声門音源波形のパラメータ制御法について検討した。ざらざら声については、基本周期ゆらぎ、振幅ゆらぎ、スペクトルゆらぎ、ならびに喉頭雑音を含む精密な音声信号モデルにもとづいた音声分析・変換・合成システムを作成し、ざらざら声を多様に制御する方式について検討した。その結果、これらのパラメータと声質に関する聴覚的印象とは互いに密接に関係していること、提案したゆらぎモデルがかなりの程度で多様なざらざら声の声質を表現できることを明らかにした。緊張性については、声門音源波形のうちの声門開放率とスペクトル傾斜を制御することで実現できることを明らかにした。 個人性については、第1から第5フォルマントの静的特徴が最も重要であり、次に音源特徴、最後にフォルマントの動的特徴であることを、大規模な聴覚実験によって明らかにした。 本研究による成果は、声質制御の可能な音声合成方式の基礎として大きな貢献をするものと確信する。
|
-
[Publications] C.S.Yang and H.Kasuya: "Automatic estimation of formant and voice source parameters using a subspace based algorithm" Proceeding of IEEE International Conference on Acoustics,Speech,and Signal Processing. (印刷中). (1998)
-
[Publications] W.Zhu and H.Kasuya: "Perceptual contributions of static and dynamic features of vocal tract characteristics to talker individuality" IEICE Trans.,Fundamentals of Electronics,Communications and Computer Sciences. E81-A,2. 268-274 (1998)
-
[Publications] W.Zhu and H.Kasuya: "A speech analysis-synthesis-editing system based on the ARX speech production model" J.Acoust.Soc.Jpn.(E). 19,3(印刷中). (1998)
-
[Publications] T.Ohtsuka, C.S.Yang and H.Kasuya: "Automatic creation of CV templates for formant type speech synthesis based on HMM-based segmentation and syllable boundary detection" Proceedings of Int.Congress Acoust.(印刷中). (1998)
-
[Publications] 松田勝敬、粕谷英樹: "ささやき声の音響理論" 日本音響学会平成9年度秋季研究発表会講演論文集. 1. 299-300 (1997)