2008 Fiscal Year Annual Research Report

音声合成における発話様式・感情表現の多様化とその応用

Research Project

Project/Area Number	07J10295
Research Institution	Tokyo Institute of Technology
Principal Investigator	橘誠 Tokyo Institute of Technology, 大学院・総合理工学研究科, 特別研究員(PD)
Keywords	音声合成 / 隠れマルコフモデル(HMM) / ヒューマンインタフェース / 感情表現を伴う音声合成 / 多様な発話様式による音声合成 / 合成音声の声質制御 / 発話様式・感情表現の推定 / 統計的音声処理
Research Abstract	音声合成システムを擬人化対話エージェントやバーチャルアクターなどの様々なアプリケーションで幅広く利用するために,多様な感情表現や発話様式を含む音声を様々な声で合成できることが望まれている.本年度はこれまでに提案した平均声モデルとモデル適応手法を用いた重回帰隠れセミマルコフモデル(重回帰HSMM)にもとづく合成音声のスタイル制御手法の有効性を,様々な話者やスタイルに適用し評価を行った,その結果,プロのナレータの音声データだけでなく,新たに収録を行った一般話者の「平静(読上げ)」「悲しげ」「楽しげ」「不安」「嫌悪」「怒り」といったスタイルにおいても,50文章(およそ3〜5分)の目標話者・目標スタイルの音声データから,その目標話者・目標スタイルの音声を合成可能であることを示し,多様な感情表現を含む音声合成を様々な話者の声で容易に実現することが可能となった. また,ユーザの好みの声で話すことのできる音声合成システムを実現するために,合成音声の声質制御手法を提案した.この手法では「太い-細い」といった制御対象とする声質について,学習に用いる複数の話者の声質の印象と学習データの音響的特徴の関係を重回帰HSMMにより学習することで,合成時の声質の印象を「少し太い声」「やや細い声」といったユーザの好みに応じて直観的に変化させることが可能である.また,平均声モデルと話者適応を用いたモデル学習を取り入れたことで,より様々な声質特徴を制御対象とすることが可能となった.これにより,仮想のキャラクタの声のような目標話者のデータが得られない場合にも,所望の合成音声を容易に作ることができると考えられる.さらに,これまで提案した少量の目標話者の音声データからの重回帰HSMMの学習法を,音声認識システムや発話様式・感情表現の表出度合の推定に利用することで,自然発話や対話といった様々な感情表現が含まれる音声の認識システムの性能向上に有効である可能性が示されており,今後の音声合成・音声認識システムの発展に寄与すると考えられる.

Research Products

(28 results)

All 2009 2008 Other

All Journal Article (14 results) (of which Peer Reviewed: 4 results) Presentation (13 results) Remarks (1 results)

[Journal Article] HMM-based style control for expressive speech synthesis with arbitrary speaker's voice using model adaptation2009
- Author(s)
  Takashi Nose, Makoto Tachibana, Takao Kobayashi
- Journal Title
  
  IEICE Trans. on Information and Systems vol. E92-D, no. 3
  
  Pages: 489-497
- Peer Reviewed
[Journal Article] テレビ放送音に対する音声と音楽およびその混合音の識別に関する検討2009
- Author(s)
  花井早紀, 橘誠, 小林隆夫
- Journal Title
  
  電子情報通信学会2009年総合大会講演論文集 D-14-13
  
  Pages: 176-176
[Journal Article] スタイル推定を用いた音声認識における音響モデル学習法の評価2009
- Author(s)
  井島勇祐, 橘誠, 能勢隆, 小林隆夫
- Journal Title
  
  日本音響学会2009年春研究発表会講演論文集 1-P-27
  
  Pages: 187-188
[Journal Article] スタイル推定を用いた自然発話音声の発話様式識別に関する検討2009
- Author(s)
  松原健, 井島勇祐, 橘誠, 能勢隆, 小林隆夫
- Journal Title
  
  日本音響学会2009年春研究発表会講演論文集 1-P-28
  
  Pages: 189-190
[Journal Article] 平均声と重回帰HSMMを用いた合成音声の多様なスタイル・声質制御の検討2009
- Author(s)
  橘誠, 河野明文, 能勢隆, 小林隆夫
- Journal Title
  
  日本音響学会2009年春研究発表会講演論文集 1-6-3
  
  Pages: 293-296
[Journal Article] 平均声に基づく音声合成における話者強調の検討2009
- Author(s)
  浅田淳一, 能勢隆, 橘誠, 小林隆夫
- Journal Title
  
  日本音響学会2009年春研究発表会講演論文集 1-6-4
  
  Pages: 297-298
[Journal Article] An on-line adaptation technique for emotional speech recognition using style estimation with multiple-regression HMM2008
- Author(s)
  Yusuke Ijima, Makoto Tachibana, Takashi Nose, Takao Kobayashi
- Journal Title
  
  Proc. 9th Annual Conference of the International Speech Communication Association, INTERSPEECH 2008 (CD-ROM)
- Peer Reviewed
[Journal Article] An estimation technique of style expressiveness for emotional speech using model adaptation based on multiple-regression HSMM2008
- Author(s)
  Takashi Nose, Yoichi Kato, Makoto Tachibana, Takao Kobayashi
- Journal Title
  
  Proc. 9th Annual Conference of the International Speech Communication Association, INTERSPEECH 2008 (CD-ROM)
- Peer Reviewed
[Journal Article] Speaker and style adaptation using average voice model for style control in HMM-based speech synthesis2008
- Author(s)
  Makoto Tachibana, Shinsuke Izawa, Takashi Nose, Takao Kobayashi
- Journal Title
  
  Proc. 2008 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2008 (CD-ROM)
- Peer Reviewed
[Journal Article] 重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法2008
- Author(s)
  井島勇祐, 橘誠, 能勢隆, 小林隆夫
- Journal Title
  
  電子情報通信学会技術研究報告 vol. 108, no. 338
  
  Pages: 37-42
[Journal Article] 平均声からの話者適応手法を用いた重回帰HSMMに基づく合成音声の声質制御2008
- Author(s)
  橘誠, 河野明文, 能勢隆, 小林隆夫
- Journal Title
  
  電子情報通信学会技術研究報告 vol. 108, no. 265
  
  Pages: 41-46
[Journal Article] スタイル推定に基づく音響モデルのオンライン適応手法2008
- Author(s)
  井島勇祐, 橘誠, 能勢隆, 小林隆夫
- Journal Title
  
  電子情報通信学会技術研究報告 vol. 108, no. 142
  
  Pages: 31-36
[Journal Article] 平均声からの話者適応を用いた合成音声の声質制御の検討2008
- Author(s)
  河野明文, 橘誠, 能勢隆, 小林隆夫
- Journal Title
  
  日本音響学会2008年秋研究発表会講演論文集 1-4-8
  
  Pages: 253-254
[Journal Article] スタイル推定に基づく音響モデルのオンライン適応手法の評価2008
- Author(s)
  井島勇祐, 橘誠, 能勢隆, 小林隆夫
- Journal Title
  
  日本音響学会2008年秋研究発表会講演論文集 2-P-10
  
  Pages: 131-132
[Presentation] テレビ放送音に対する音声と音楽およびその混合音の識別に関する検討2009
- Author(s)
  花井早紀
- Organizer
  電子情報通信学会2009年総合大会
- Place of Presentation
  愛媛大学
- Year and Date
  2009-03-20
[Presentation] スタイル推定を用いた音声認識における音響モデル学習法の評価2009
- Author(s)
  井島勇祐
- Organizer
  日本音響学会2009年春研究発表会
- Place of Presentation
  東京工業大学
- Year and Date
  2009-03-17
[Presentation] スタイル推定を用いた自然発話音声の発話様式識別に関する検討2009
- Author(s)
  松原健
- Organizer
  日本音響学会2009年春研究発表会
- Place of Presentation
  東京工業大学
- Year and Date
  2009-03-17
[Presentation] 平均声と重回帰HSMMを用いた合成音声の多様なスタイル・声質制御の検討2009
- Author(s)
  橘誠
- Organizer
  日本音響学会2009年春研究発表会
- Place of Presentation
  東京工業大学
- Year and Date
  2009-03-17
[Presentation] 平均声に基づく音声合成における話者強調の検討2009
- Author(s)
  浅田淳一
- Organizer
  日本音響学会2009年春研究発表会
- Place of Presentation
  東京工業大学
- Year and Date
  2009-03-17
[Presentation] 重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法2008
- Author(s)
  井島勇祐
- Organizer
  第10回音声言語シンポジウム
- Place of Presentation
  早稲田大学
- Year and Date
  2008-12-09
[Presentation] 平均声からの話者適応手法を用いた重回帰HSMMに基づく合成音声の声質制御2008
- Author(s)
  橘誠
- Organizer
  IEEE SPS-JC・音声研究会共催講演会および音声研究会
- Place of Presentation
  熊本大学
- Year and Date
  2008-10-23
[Presentation] An estimation technique of style expressiveness for emotional speech using model adaptation based on multiple-regression HSMM2008
- Author(s)
  Takashi Nose
- Organizer
  INTERSPEECH 2008
- Place of Presentation
  Brisbane, Australia
- Year and Date
  2008-09-26
[Presentation] An on-line adaptation technique for emotional speech recognition using style estimation with multiple-regression HMM2008
- Author(s)
  Yusuke Ijima
- Organizer
  INTERSPEECH 2008
- Place of Presentation
  Brisbane, Australia
- Year and Date
  2008-09-24
[Presentation] スタイル推定に基づく音響モデルのオンライン適応手法の評価2008
- Author(s)
  井島勇祐
- Organizer
  日本音響学会2008年秋研究発表会
- Place of Presentation
  九州大学
- Year and Date
  2008-09-11
[Presentation] 平均声からの話者適応を用いた合成音声の声質制御の検討2008
- Author(s)
  河野明文
- Organizer
  日本音響学会2008年秋研究発表会
- Place of Presentation
  九州大学
- Year and Date
  2008-09-10
[Presentation] 重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法2008
- Author(s)
  井島勇祐
- Organizer
  音声研究会
- Place of Presentation
  岩手県立大学
- Year and Date
  2008-07-17
[Presentation] Speaker and style adaptation using average voice model for style control in HMM-based speech synthesis2008
- Author(s)
  Makoto Tachibana
- Organizer
  ICASSP 2008
- Place of Presentation
  Las Vegas, USA
- Year and Date
  2008-04-03
[Remarks]
- URL
  http://www.kbys.ip.titech.ac.jp/

2008 Fiscal Year Annual Research Report

音声合成における発話様式・感情表現の多様化とその応用

Principal Investigator

橘 誠 Tokyo Institute of Technology, 大学院・総合理工学研究科, 特別研究員(PD)

Research Products

[Journal Article] HMM-based style control for expressive speech synthesis with arbitrary speaker's voice using model adaptation2009

Author(s)

Journal Title

[Journal Article] テレビ放送音に対する音声と音楽およびその混合音の識別に関する検討2009

Author(s)

Journal Title

[Journal Article] スタイル推定を用いた音声認識における音響モデル学習法の評価2009

Author(s)

Journal Title

[Journal Article] スタイル推定を用いた自然発話音声の発話様式識別に関する検討2009

Author(s)

Journal Title

[Journal Article] 平均声と重回帰HSMMを用いた合成音声の多様なスタイル・声質制御の検討2009

Author(s)

Journal Title

[Journal Article] 平均声に基づく音声合成における話者強調の検討2009

Author(s)

Journal Title

[Journal Article] An on-line adaptation technique for emotional speech recognition using style estimation with multiple-regression HMM2008

Author(s)

Journal Title

[Journal Article] An estimation technique of style expressiveness for emotional speech using model adaptation based on multiple-regression HSMM2008

Author(s)

Journal Title

[Journal Article] Speaker and style adaptation using average voice model for style control in HMM-based speech synthesis2008

Author(s)

Journal Title

[Journal Article] 重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法2008

Author(s)

Journal Title

[Journal Article] 平均声からの話者適応手法を用いた重回帰HSMMに基づく合成音声の声質制御2008

Author(s)

Journal Title

[Journal Article] スタイル推定に基づく音響モデルのオンライン適応手法2008

Author(s)

Journal Title

[Journal Article] 平均声からの話者適応を用いた合成音声の声質制御の検討2008

Author(s)

Journal Title

[Journal Article] スタイル推定に基づく音響モデルのオンライン適応手法の評価2008

Author(s)

Journal Title

[Presentation] テレビ放送音に対する音声と音楽およびその混合音の識別に関する検討2009

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] スタイル推定を用いた音声認識における音響モデル学習法の評価2009

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] スタイル推定を用いた自然発話音声の発話様式識別に関する検討2009

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 平均声と重回帰HSMMを用いた合成音声の多様なスタイル・声質制御の検討2009

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 平均声に基づく音声合成における話者強調の検討2009

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法2008

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 平均声からの話者適応手法を用いた重回帰HSMMに基づく合成音声の声質制御2008

Author(s)

Organizer

橘誠 Tokyo Institute of Technology, 大学院・総合理工学研究科, 特別研究員(PD)