• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

柔軟な声質制御の可能な音声合成方式の研究

研究課題

研究課題/領域番号 08680386
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関宇都宮大学

研究代表者

粕谷 英樹  宇都宮大学, 工学部, 教授 (20006240)

研究分担者 楊 長盛  宇都宮大学, 工学部, 助手 (80272219)
研究期間 (年度) 1996 – 1997
研究課題ステータス 完了 (1997年度)
配分額 *注記
2,600千円 (直接経費: 2,600千円)
1997年度: 700千円 (直接経費: 700千円)
1996年度: 1,900千円 (直接経費: 1,900千円)
キーワード音声合成 / 声質 / 個人性 / ARX分析 / フォルマント / 音源特徴 / 嗄声 / ささやき / フォルマント合成
研究概要

われわれの目指す柔軟な声質制御とは、ささやき、気息性、緊張性などのいわゆる狭義の声質と話者の音声器官の生理学的違いに起因する個人性を多様に制御することであり、本研究課題の目的はそのための音声合成方式の基礎を確立することである。本年度は昨年度に開発した時変ARX(Autoregressivewith exogeneous input)音声分析法を用いて、国際音声学会議が制定した「ささやき(whisper)、気息性(breathy)、ざらざら声(harsh)」に、緊張性(tense)を加えた声質の制御法について詳細に検討した。
ささやきについては、昨年度考案した制御法の根拠になる音響理論について詳細に検討し、MR画像や電子内視鏡による発声中の喉頭の挙動に関する計測と音響シミュレーションを行って、従来の定説とは異なる新しい機構を見出した。気息性については、喉頭雑音の強度並びに声門音源波形のパラメータ制御法について検討した。ざらざら声については、基本周期ゆらぎ、振幅ゆらぎ、スペクトルゆらぎ、ならびに喉頭雑音を含む精密な音声信号モデルにもとづいた音声分析・変換・合成システムを作成し、ざらざら声を多様に制御する方式について検討した。その結果、こららのパラメータと声質に関する聴覚的印象とは互いに密接に関係していること、提案したゆらぎモデルがかなりの程度で多様なざらざら声の声質を表現できることを明らかにした。緊張性については、声門音源波形のうちの声門開放率とスペクトル傾斜を制御することで実現できることを明らかにした。
個人性については、第1から第5フォルマントの性的特徴が最も重要であり、次に音源特徴、最後にフォルマントの動的特徴であることを大規模な聴覚実験によって明らかにした。
本研究による成果は、声質制御の可能な音声合成方式の基礎として大きな貢献をするものと確信する。

報告書

(3件)
  • 1997 実績報告書   研究成果報告書概要
  • 1996 実績報告書
  • 研究成果

    (17件)

すべて その他

すべて 文献書誌 (17件)

  • [文献書誌] 松田 勝敬, 粕谷 英樹: "ささやき声の音響理論" 日本音響学会平成9年度秋季研究発表会講演論文集. I. 299-300 (1997)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] C.S. Yang and H.Kasuya: "Automatic estimation of formant and voice source paramenters using a subspace based algorithm" Proceeding of IEEE International Confernce on Acoustics,Speech,and Signal Processing. (印刷中). (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] W.Zhu and H.Kasuya: "Perceptual contributions of static and dynamic features of vocal tract characteristics to talker individuality" IEICE Trans.,Fundamentals of Electronics,Communications and Computer Sciences. E81-A,2. 268-274 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] W.Zhu and H.Kasuya: "A speech analysis-synthesis-editing system based on the ARX speech production model" J.Acosut.Soc.Jpn.(E). 19,3(印刷中). (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] T.Ohtuska, C.S. Yang and H.Kasuya: "Automatic creation of CV templates for formant type speech synthesis based on HMM-based segmentation and syllable boundary detection" Proceedings of International Congress on Acoustics. (印刷中). (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] 遠藤 康男, 粕谷 英樹: "周期ごとのゆらぎを考慮した音声の分析・変換・合成システム" 電子情報通信学会論文誌A. (掲載決定). (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] C.S.Yang and H.Kasuya: "Automatic estimation of formant and voice source parameters using a subspace based algorithm" Proceeding of IEEE International Conference on Acoustics, Speech, and Signal Preocessing. (in print.). (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] W.Zhu and H.Kasuya: "Perceptual contributions of static and dynamic features of vocal tract characteristics to talker individuality" IEICE Trans., Fundamentals of Electronics, Communications and Computer Sciences. E81-A,No.2. 268-274 (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] W.Zhu and H.Kasuya: "A speech analysis-synthesis-editing system based on the ARX production model" J.Acoust.Soc.Jpn.(E). Vol.19, No.3 (in print.). (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] T.Ohtsuka, C.S.yang and H.Kasuya: "Automatic creation of CV templates for formant type speech synthesis based on HMM-based segmentation and syllable boundary detection" Proceedings of Int.Congress Acoust.(in print.). (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] M.Matsuda and H.Kasuya: "An acoustic theory about whisper" Proceedings of The 1997 Autumn Meeting of the Acoustical Society of Japan. 299-300 (1997)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] C.S.Yang and H.Kasuya: "Automatic estimation of formant and voice source parameters using a subspace based algorithm" Proceeding of IEEE International Conference on Acoustics,Speech,and Signal Processing. (印刷中). (1998)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] W.Zhu and H.Kasuya: "Perceptual contributions of static and dynamic features of vocal tract characteristics to talker individuality" IEICE Trans.,Fundamentals of Electronics,Communications and Computer Sciences. E81-A,2. 268-274 (1998)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] W.Zhu and H.Kasuya: "A speech analysis-synthesis-editing system based on the ARX speech production model" J.Acoust.Soc.Jpn.(E). 19,3(印刷中). (1998)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] T.Ohtsuka, C.S.Yang and H.Kasuya: "Automatic creation of CV templates for formant type speech synthesis based on HMM-based segmentation and syllable boundary detection" Proceedings of Int.Congress Acoust.(印刷中). (1998)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 松田勝敬、粕谷英樹: "ささやき声の音響理論" 日本音響学会平成9年度秋季研究発表会講演論文集. 1. 299-300 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] W.Ding,et al.: "Fast and robust joint estimation of vocal tract and voice source parameters" Proc. ICASSP97. (1997)

    • 関連する報告書
      1996 実績報告書

URL: 

公開日: 1996-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi