• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2007 年度 実績報告書

出力単語の語彙属性を用いた対話韻律制御に基づく音声合成

研究課題

研究課題/領域番号 18300063
研究機関早稲田大学

研究代表者

匂坂 芳典  早稲田大学, 大学院・国際情報通信研究科, 教授 (70339737)

研究分担者 小林 哲則  早稲田大学, 理工学部, 教授 (30162001)
誉田 雅彰  早稲田大学, スポーツ科学学術院, 教授 (90367095)
キーワード音声合成 / 韻律制御 / 対話音声 / イントネーション / 基本周波数 / パラ言語情報
研究概要

本年度は、昨年度に明らかになった3次元の発話印象(確信・疑念、肯定・否定、好印象・悪印象)とFOの時間変化形状を現す4種のダイナミックパタン(上昇、平坦、下降、上昇後下降)の対応関係の言語普遍性を調べため、言語間に渡る対話韻律生成実験を行った。多次元尺度溝成法(MDS)を利用した分析により得られた日本語-語発話「ん」が有する声帯の基本周波数(FO)特性とその聴覚印象関係を用いて、中国語単語の対話音声を合成した。FOの変更には指令応答モデルを使用し、合成対象の中国語語彙自身が与える印象に対応した日本語「ん」の音声が有する韻律特性を用い、読み上げ中国語音声の韻律制御パラメータを変形することにより対話韻律を実現した。作成した中国語対話合成音声の自然性評価実験の結果、先に提案した印象ベクトル表現に基づく韻律生成法が言語共通に使用できる可能性を確認できた。この実験を通じて発話印象と対話韻律との関係は、一般性を持つことが示された。
発話印象と対話韻律との関係がより明確に規定できれば、当該研究目的の対話音声合成に役立つのみならず、いわゆるバラ言語情報の記述、認識といった、さらに広い分野への適用可能性が拡大する。このため、日本語-語発話「ん」の印象自動抽出実験を行った。日本語-語発話「ん」の音声の基本周波数平均値、ダイナミックレンジ、正規化パタン概形、持続時間から「ん」の印象を自動推定する方法を考案し、オープン実験によりその有効性を確認できた。この結果、いわば対話韻律合成の逆写像の可能性が示された。これによって、これまで、工学のみならず音声学でも手付かずにいた韻律が有するバラ言語情報の記述に道を開き、それらの合成・認識の実現手段を提供することができた。

  • 研究成果

    (7件)

すべて 2008 2007

すべて 学会発表 (6件) 図書 (1件)

  • [学会発表] Communicative prosody processing for synthesis and recognition of para-linguistic information2008

    • 著者名/発表者名
      Y. Sagisaka, Y. Greenberg, K. Li, M. Zhu, M. Tsuzaki and H. Kato
    • 学会等名
      ICCA 2008
    • 発表場所
      Yangon
    • 年月日
      2008-02-14
  • [学会発表] Automatic extraction of paralinguistic information from communicative speech2007

    • 著者名/発表者名
      Mingzhao Zhu, Ke Li, Yoko Greenberg and Yoshinori Sagisaka
    • 学会等名
      SNLP 2007
    • 発表場所
      Pattaya
    • 年月日
      20070900
  • [学会発表] 印象表現ベクトルに基づく言語間韻律変換2007

    • 著者名/発表者名
      李 克, グリーンバーグ 陽子, 匂坂 芳典
    • 学会等名
      日本音響学会2007年秋季研究発表会
    • 発表場所
      山梨
    • 年月日
      20070900
  • [学会発表] 自然発話の韻律情報に基づく聴覚印象の自動抽出2007

    • 著者名/発表者名
      朱 明朝, 李 克, グリーンバーグ 陽子, 匂坂 芳典
    • 学会等名
      日本音響学会2007年秋季研究発表会
    • 発表場所
      山梨
    • 年月日
      20070900
  • [学会発表] Inter-language prosodic style modification experiment using word impression vector for communicative speech generation2007

    • 著者名/発表者名
      Ke Li, Yoko Greenberg and Yoshinori Sagisaka
    • 学会等名
      Interspeech 2007
    • 発表場所
      Antwerp
    • 年月日
      20070800
  • [学会発表] Prosody Generation for Communicative Speech Synthesis2007

    • 著者名/発表者名
      Yoshinori Sagisaka
    • 学会等名
      Taiwan-Japan Joint Workshop on Speech Science and Technologies
    • 発表場所
      台北
    • 年月日
      20070500
  • [図書] NATO Security through Science Series E: Human and Societal Dynamics Vol.8 The Fundamentals of Verbal and Non-verbal Communication and the Biometric Issue2007

    • 著者名/発表者名
      K. Li, Y.Greenberg, N.Shibuya, N.Campbell, Y.Sagisaka
    • 総ページ数
      179-183
    • 出版者
      IOS Press

URL: 

公開日: 2010-02-04   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi