• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

出力単語の語彙属性を用いた対話韻律制御に基づく音声合成

研究課題

研究課題/領域番号 18300063
研究機関早稲田大学

研究代表者

匂坂 芳典  早稲田大学, 大学院国際情報通信研究科, 教授 (70339737)

研究分担者 小林 哲則  早稲田大学, 理工学部, 教授 (30162001)
誉田 雅彰  早稲田大学, スポーツ科学学術院, 教授 (90367095)
キーワード音声合成 / 韻律制御 / 対話音声 / イントネーション / 基本周波数
研究概要

本年度は、対話音声を合成するために必要な、対話音声の韻律出力自由度の規定および、それに必要な入力情報の規定を進めた。我々は既に一語発話「ん」が有する声帯の基本周波数(FO)特性とその聴覚印象の分析を通じ、両者に深い関連があることを明らかにしている。多次元尺度構成法(MDS)を利用した分析の結果、発話印象は3次元(確信・疑念、肯定・否定、好印象・悪印象)によって近似的に記述できることが分かり、韻律制御との対応が明らかとなった。「確信・疑念」、「肯定・否定」に対応する印象はF0の時間変化形状を現す4種のダイナミックパタン(上昇、平坦、下降、上昇後下降)とよく呼応し、「好印象・悪印象」に対応する印象は基本周波数F0の高さに反映される事が判明した。この実験事実に基づき、語彙が有する印象情報を利用した韻律生成法を新たに提案した。この対話韻律生成法では、入力語彙自身が与える印象から抽出した韻律属性を用い、従前からの制御として得られる韻律制御パラメータの変形を行う。対話韻律生成の制御変数として新たに印象ベクトル表現を導入し、出力語彙から想起される発話状況にデフォルトの韻律を推定、生成する。
提案した対話韻律生成法の妥当性を確認するため、合成音声を作成し、聴取実験を行った。提案する合成方法では、生成過程のモデルとしてよく知られたF0指令応答モデルを用い、種々の印象に対応する「ん」のF0時間変化パタン特性を合成対象とする各単文節音声のF0生成に加えることにより、対話F0パタンを合成する。提案した対話韻律生成法の有効性を評価するため、得られた対話F0パタンによるSTRAGHT合成音の自然性評価試験を行い、提案法の有効性が確認できた。

  • 研究成果

    (4件)

すべて 2006

すべて 雑誌論文 (4件)

  • [雑誌論文] A trial of communicative prosody generation based on control characteristic of one word utterance observed in real conversational speech2006

    • 著者名/発表者名
      Y.Greenberg, N.Shibuya, M.Tsuzaki, H.Kato, Y.Sagisaka
    • 雑誌名

      Proc. Speech prosody 2006

      ページ: 37-40

  • [雑誌論文] Towards Computing Phonetics2006

    • 著者名/発表者名
      Y.Nagasaki
    • 雑誌名

      Proc. The 7th Phonetic Conference of China and International forum on Phonetic Frontiers

  • [雑誌論文] 音声学研究の輝かしい展開を求めて-数理モデルからの提案-2006

    • 著者名/発表者名
      勾坂芳典
    • 雑誌名

      日本音声学会創立80周年記念フォーラム発表論文集

  • [雑誌論文] 印象表現によるパラ言語情報を用いた韻律制御2006

    • 著者名/発表者名
      李 克, グリーンバーグ陽子, 渋谷 渚, 勾坂芳典
    • 雑誌名

      日本音響学会2006年秋季研究発表会論文集

      ページ: 233-234

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi