• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2009 年度 実績報告書

個性及び表現性ロバストな音声言語インタフェースに関する研究

研究課題

研究課題/領域番号 21300063
研究機関東京工業大学

研究代表者

小林 隆夫  東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)

キーワードHMM音声合成 / テキスト音声合成 / 声質変換 / 対話音声合成 / FO量子化 / 重回帰HMM / 発話様式 / モデル適応
研究概要

本研究はロバスト音声合成とロバスト音声認識に関する5項目の基盤要素技術の研究・開発からなり,本年度は以下の成果が得られた。
感情表現・発話様式・声質を制御可能な音声合成に関しては,隠れマルコフモデルに基づく音声合成(HMM音声合成)の枠組みに,基本周波数(FO)量子化に基づく韻律コンテキストを導入することを提案し,FOの正規化及び量子化方法の検討,平均声モデルに基づくテキスト音声合成を利用した韻律コンテキストの付与手法等の基本的な検討を行い,韻律モデルの教師なし学習が可能となることを示した。さらに,提案法を声質変換に適用した場合の有用性を示した。
自然発話・会話音声の合成に関しては,HMM音声合成の枠組みに基づいて,日本語話し言葉音声コーパス(CSJ)を用いた対話音声の合成のための音響モデル構築手法の検討を行い,音響モデル構築に用いるコンテキストの重要性を明らかにした。
パラ言語情報の検出・表出度合推定では,重回帰HMMに基づいたスタイル推定手法を提案し,感情表現や発話様式の種別のみならず,その表現度合を連続量として推定可能なことを示した。また,自然発話音声の発話様式の識別に応用し,その有用性を示した。
話者・スタイル変動に頑健な音声認識に関しては,重回帰HMMに基づいた高速なスタイル適応方式を提案し,感情音声や自然発話音声の認識におけるモデル適応に利用した場合,1文章毎のオンライン適応という少量の適応データしか使用できない場合でも認識率が向上することを明らかにした。
動作からのパラ言語情報の抽出に関しては,3次元フェイスモデルに基づいて話し手の顔の3次元姿勢を推定し,この時間的変位から動作の分類や非言語情報を獲得する手法の基礎的な検討を行った。

  • 研究成果

    (34件)

すべて 2010 2009

すべて 雑誌論文 (18件) (うち査読あり 6件) 学会発表 (16件)

  • [雑誌論文] A rapid model adaptation technique for emotional speech recognition with style estimation based on multiple-regression HMM2010

    • 著者名/発表者名
      Yusuke Ijima
    • 雑誌名

      IEICE Transactions on Information and Systems E93-D

      ページ: 107-115

    • 査読あり
  • [雑誌論文] A technique for estimating intensity of emotional expressions and speaking styles in speech based on multiple-regression HSMM2010

    • 著者名/発表者名
      Takashi Nose
    • 雑誌名

      IEICE Transactions on Information and Systems E93-D

      ページ: 116-124

    • 査読あり
  • [雑誌論文] HMM-based speech synthesis with unsupervised labeling of accentual context based on F0 quantization and average voice model2010

    • 著者名/発表者名
      Takashi Nose
    • 雑誌名

      Proc.2010 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2010

      ページ: 4622-4625

    • 査読あり
  • [雑誌論文] F0量子化と非パラレル学習に基づく声質変換の評価2010

    • 著者名/発表者名
      太田悠平
    • 雑誌名

      電子情報通信学会技術研究報告 SP2009-100

      ページ: 27-32

  • [雑誌論文] 平均声に基づく対話音声合成に関する検討2010

    • 著者名/発表者名
      郡山知樹
    • 雑誌名

      電子情報通信学会技術研究報告 SP2009-107

      ページ: 33-38

  • [雑誌論文] HMMに基づく対話音声合成のための発話単位の検討2010

    • 著者名/発表者名
      郡山知樹
    • 雑誌名

      日本音響学会2010年春季研究発表会講演論文集

      ページ: 143-144

  • [雑誌論文] 量子化F0コンテキストを用いたHMMに基づく不特定話者声質変換の検討2010

    • 著者名/発表者名
      太田悠平
    • 雑誌名

      日本音響学会2010年春季研究発表会講演論文集

      ページ: 327-328

  • [雑誌論文] 量子化F0韻律コンテキストを用いたHMM音声合成の評価2010

    • 著者名/発表者名
      大木康次郎
    • 雑誌名

      日本音響学会2010年春季研究発表会講演論文集

      ページ: 341-342

  • [雑誌論文] HMM音声合成における韻律コンテキストの評価2010

    • 著者名/発表者名
      横溝秀始
    • 雑誌名

      日本音響学会2010年春季研究発表会講演論文集

      ページ: 403-404

  • [雑誌論文] Speaking style adaptation for spontaneous speech recognition using multiple-regression HMM2009

    • 著者名/発表者名
      Yusuke Ijima
    • 雑誌名

      Proc.10th Annual Conference of the International Speech Communication Association, INTERSPEECH 2009

      ページ: 552-555

    • 査読あり
  • [雑誌論文] HMM-based speaker characteristics emphasis using average voice model2009

    • 著者名/発表者名
      Takashi Nose
    • 雑誌名

      Proc.10th Annual Conference of the International Speech Communication Association, INTERSPEECH 2009

      ページ: 2631-2634

    • 査読あり
  • [雑誌論文] Emotional speech recognition based on style estimation and adaptation with multiple-regression HMM2009

    • 著者名/発表者名
      Yusuke Ijima
    • 雑誌名

      Proc.2009 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2009

      ページ: 4157-4160

    • 査読あり
  • [雑誌論文] F0量子化に基づく韻律コンテキストを用いたHMM音声合成2009

    • 著者名/発表者名
      大木康次郎
    • 雑誌名

      電子情報通信学会技術研究報告 SP2009-87

      ページ: 141-146

  • [雑誌論文] F0量子化と非パラレル学習に基づく声質変換の検討2009

    • 著者名/発表者名
      太田悠平
    • 雑誌名

      電子情報通信学会技術研究報告 SP2009-91

      ページ: 171-176

  • [雑誌論文] 重回帰HMMに基づく自然発話音声の発話様式識別2009

    • 著者名/発表者名
      能勢隆
    • 雑誌名

      電子情報通信学会技術研究報告 SP2009-46

      ページ: 31-36

  • [雑誌論文] HMMに基づく対話音声合成の検討2009

    • 著者名/発表者名
      郡山知樹
    • 雑誌名

      日本音響学会2009年秋季研究発表会講演論文集

      ページ: 255-256

  • [雑誌論文] HMM音声合成におけるF0モデルの教師なし学習の検討2009

    • 著者名/発表者名
      大木康次郎
    • 雑誌名

      日本音響学会2009年秋季研究発表会講演論文集

      ページ: 259-260

  • [雑誌論文] F0量子化と非パラレル学習に基づく声質変換2009

    • 著者名/発表者名
      太田悠平
    • 雑誌名

      日本音響学会2009年秋季研究発表会講演論文集

      ページ: 289-290

  • [学会発表] HMM-based speech synthesis with unsupervised labeling of accentual context based on F0 quantization and average voice model2010

    • 著者名/発表者名
      Takashi Nose
    • 学会等名
      2010 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2010
    • 発表場所
      Dallas, Texas, USA
    • 年月日
      2010-03-17
  • [学会発表] HMMに基づく対話音声合成のための発話単位の検討2010

    • 著者名/発表者名
      郡山知樹
    • 学会等名
      日本音響学会2010年春季研究発表会
    • 発表場所
      電気通信大学,東京都調布市
    • 年月日
      2010-03-10
  • [学会発表] 量子化F0韻律コンテキストを用いたHMM音声合成の評価2010

    • 著者名/発表者名
      大木康次郎
    • 学会等名
      日本音響学会2010年春季研究発表会
    • 発表場所
      電気通信大学,東京都調布市
    • 年月日
      2010-03-09
  • [学会発表] 量子化F0コンテキストを用いたHMMに基づく不特定話者声質変換の検討2010

    • 著者名/発表者名
      太田悠平
    • 学会等名
      日本音響学会2010年春季研究発表会
    • 発表場所
      電気通信大学,東京都調布市
    • 年月日
      2010-03-08
  • [学会発表] HMM音声合成における韻律コンテキストの評価2010

    • 著者名/発表者名
      横溝秀始
    • 学会等名
      日本音響学会2010年春季研究発表会
    • 発表場所
      電気通信大学,東京都調布市
    • 年月日
      2010-03-08
  • [学会発表] F0量子化と非パラレル学習に基づく声質変換の評価2010

    • 著者名/発表者名
      太田悠平
    • 学会等名
      電子情報通信学会・音声研究会
    • 発表場所
      京都大学,京都市
    • 年月日
      2010-01-21
  • [学会発表] 平均声に基づく対話音声合成に関する検討2010

    • 著者名/発表者名
      郡山知樹
    • 学会等名
      電子情報通信学会・音声研究会
    • 発表場所
      京都大学,京都市
    • 年月日
      2010-01-21
  • [学会発表] F0量子化に基づく韻律コンテキストを用いたHMM音声合成2009

    • 著者名/発表者名
      大木康次郎
    • 学会等名
      電子情報通信学会
    • 発表場所
      東京大学,東京都文京区
    • 年月日
      2009-12-21
  • [学会発表] F0量子化と非パラレル学習に基づく声質変換の検討2009

    • 著者名/発表者名
      太田悠平
    • 学会等名
      電子情報通信学会
    • 発表場所
      東京大学,東京都文京区
    • 年月日
      2009-12-21
  • [学会発表] F0量子化と非パラレル学習に基づく声質変換2009

    • 著者名/発表者名
      太田悠平
    • 学会等名
      日本音響学会2009年秋季研究発表会
    • 発表場所
      日本大学,福島県郡山市
    • 年月日
      2009-09-16
  • [学会発表] HMMに基づく対話音声合成の検討2009

    • 著者名/発表者名
      郡山知樹
    • 学会等名
      日本音響学会2009年秋季研究発表会
    • 発表場所
      日本大学,福島県郡山市
    • 年月日
      2009-09-15
  • [学会発表] HMM音声合成におけるF0モデルの教師なし学習の検討2009

    • 著者名/発表者名
      大木康次郎
    • 学会等名
      日本音響学会2009年秋季研究発表会
    • 発表場所
      日本大学,福島県郡山市
    • 年月日
      2009-09-15
  • [学会発表] HMM-based speaker characteristics emphasis using average voice model2009

    • 著者名/発表者名
      Takashi Nose
    • 学会等名
      10th Annual Conference of the International Speech Communication Association, INTERSPEECH 2009
    • 発表場所
      Brighton, UK
    • 年月日
      2009-09-10
  • [学会発表] Speaking style adaptation for spontaneous speech recognition using multiple-regression HMM2009

    • 著者名/発表者名
      Yusuke Ijima
    • 学会等名
      10th Annual Conference of the International Speech Communication Association, INTERSPEECH 2009
    • 発表場所
      Brighton, UK
    • 年月日
      2009-09-07
  • [学会発表] 重回帰HMMに基づく自然発話音声の発話様式識別2009

    • 著者名/発表者名
      能熱隆
    • 学会等名
      電子情報通信学会 音声研究会
    • 発表場所
      飯坂ホテル聚楽,福島県福島市
    • 年月日
      2009-07-18
  • [学会発表] Emotional speech recognition based on style estimation and adaptation with multiple-regression HMM2009

    • 著者名/発表者名
      Yusuke Ijima
    • 学会等名
      2009 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2009
    • 発表場所
      Taipei, Taiwan
    • 年月日
      2009-04-21

URL: 

公開日: 2011-06-16   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi