• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2004 Fiscal Year Annual Research Report

多様な声質を実現する音声合成のための自動ボイスビルダー

Research Project

Project/Area Number 14380160
Research InstitutionNagoya Institute of Technology

Principal Investigator

徳田 恵一  名古屋工業大学, 工学研究科, 教授 (20217483)

Co-Investigator(Kenkyū-buntansha) 北村 正  名古屋工業大学, 工学研究科, 教授 (60114865)
小林 隆夫  東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)
益子 貴史  東京工業大学, 大学院・総合理工学研究科, 助手 (90272715)
Keywords音声合成 / 声質 / 感情音声 / HMM音声合成 / ラベリング / 自動ボイスビルディング / PLEd
Research Abstract

音声データに付与すべき情報は,アクセント,品詞,活用形,活用形,文構造,読み,発音,更には,単語に対するフォーカス,発話様式など,複数あり,それらはお互いに何らかの相互関係をもっているため,独立に取り扱った場合には,データの不整合を引き起こし,人手でこれを修復することは困難となる.当該研究グループでは,音声データベースに付与された韻律・言語情報ファイルを人手,あるいは簡易編集プログラムにより,編集していたが,この作業は忍耐強いものであり,しばしば記述の間違いを引き起こしていた.このため,言語情報ファイルの編集作業が,大量の音声データを学習するための障害となっていた.この問題を解決するには,ラベリング作業を効率的に行う手法とそのためのソフトウェアツールの開発が急務であり,更には,ラベリング自体を人手を介さず自動的に行うことが,音声合成システムの自動構築のためには必須である.平成14年度では,まず,ラベリングを効率的に行う手法およびソフトウェアツールを開発し,それを用いて実際に大量の音声データに効率的にラベル付けを行うことを可能とした.平成15年度は,得られた音声データをベース用いて音声合成用統計モデルを学習し,このモデルに基づいてラベリングを自動的に行う手法を開発した.平成16年度においては,システムを更にチューニングし,評価を行った.まとめると以下の通りとなる.
(1)自動ラベル付け手法を更に改善した.
(2)実際に音声合成システムを自動構築し,評価を行った.
(3)評価結果に基づき,問題点を洗い出すとともに,更なる改善を行った.

  • Research Products

    (32 results)

All 2005 2004

All Journal Article (32 results)

  • [Journal Article] パラメータ出力確率を考慮したポストフィルタ設計法2005

    • Author(s)
      戸田智基, 徳田恵一
    • Journal Title

      日本音響学会2005年春季研究発表会講演論文集 vol.I

      Pages: 195-196

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] Applying sparse KPCA for feature extraction in speech recognition2005

    • Author(s)
      Amaro Lima, Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda
    • Journal Title

      IEICE Transactions on Information Systems 発表予定

  • [Journal Article] Continuous speech recognition based on general factor dependent acoustic models2005

    • Author(s)
      Hiroyuki Suzuki, Heiga Zen, Yoshihiko Nankaku, Chiyomi Miyajima, Keiichi Tokuda, Tadashi Kitamura
    • Journal Title

      MICE Transactions on Information Systems 発表予定

  • [Journal Article] Parameter Sharing in Mixture of Factor Analyzers for Speaker Identification2005

    • Author(s)
      Hiroyoshi Yamamoto, Yoshihiko Nankaku, Chiyomi Miyajima, Keiichi Tokuda, Tadashi Kitamura
    • Journal Title

      IEICE Transactions on Information Systems 発表予定

  • [Journal Article] Deterministic annealing EM algorithm in acoustic modeling for speaker and speech recognition2005

    • Author(s)
      Yohei Itaya, Heiga Zen, Yoshihiko Nankaku, Chiyomi Miyajima, Keiich Tokuda, Tadashi Kitamura
    • Journal Title

      IEICE Transactions on Information Systems 発表予定

  • [Journal Article] Minimum classification error interactive training for speaker identification2005

    • Author(s)
      Yusuke Kida, Hiroyoshi Yamamoto, Chiyomi Miyajima, Keiichi Tokuda, Tadashi Kitamura
    • Journal Title

      2005 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2005) (In Press)

  • [Journal Article] Sparse KPCA for feature extraction in speech recognition2005

    • Author(s)
      Amaro Azevedo de Lima, Heiga Zen, Yoshihiko Nankaku, Chiyomi Miyajima, Keiichi Tokuda, Tadashi Kitamura
    • Journal Title

      2005 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2005) (In Press)

  • [Journal Article] Spectral conversion based on maximum likelihood estimation considering global variance of converted parameter2005

    • Author(s)
      Tomoki Toda, Alan W.Black, Keiichi Tokuda
    • Journal Title

      2005 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2005) (In Press)

  • [Journal Article] A Chinese text-to-speech synthesis in ATR2005

    • Author(s)
      Jinfu Ni, Hisashi Kawai, Tomoki Coda, Keiichi Tokuda, Nobuyoki Nishizawa
    • Journal Title

      日本音響学会2005年春季研究発表会講演論文集 vol.I

      Pages: 287-289

  • [Journal Article] スペクトル・FO・継続長決定木の同時バックオフに基づくHMM音声合成2005

    • Author(s)
      片岡俊介, 全 炳河, 南角吉彦, 徳田恵一, 北村 正
    • Journal Title

      日本音響学会2005年春季研究発表会講演論文集 vol.I

      Pages: 193-194

  • [Journal Article] 決定木に基づく音素コンテキスト・次元・状態位置の同時クラスタリングによる音響モデリング2004

    • Author(s)
      全 炳河, 徳田恵一, 北村 正
    • Journal Title

      電子情報通信学会論文誌(D-II) vol.87-D-II, no.8

      Pages: 1593-1602

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] HMMに基づくテキスト音声合成への混合励振源モデルとポストフィルタの導入2004

    • Author(s)
      吉村貴克, 徳田恵一, 益子貴史, 小林隆夫, 北村正
    • Journal Title

      電子情報通信学会論文誌(D-II) vol.87-D-II, no.8

      Pages: 1565-1571

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] Decision-tree backing-off in HMM-based speech synthesis2004

    • Author(s)
      Shunsuke Kataoka, Nobuaki Mizutani, Keiichi Tokuda, Tadashi Kitamura
    • Journal Title

      International Conference on Spoken Language Processing (INTERSPEECH2000-ICSLP2000) vol.2

      Pages: II-1205-II-1208

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] Constructing emotional speech synthesizers with limited speech database2004

    • Author(s)
      Ryosuke Tsuzuki, Heiga Zen, Keiichi Tokuda, Tadashi Kitamura, Murtaza Bulut, Shrikanth S.Narayanan
    • Journal Title

      International Conference on Spoken Language Processing (INTERSPEECH2004-ICSLP2004) vol.2

      Pages: II-1185-II-1188

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] Acoustic-to-articulatory inversion mapping with Gaussian mixture model2004

    • Author(s)
      Tomoki Toda, Alan W.Black, Keiichi Tokuda
    • Journal Title

      International Conference on Spoken Language Processing (INTERSPEECH2004-ICSLP2004) vol.2

      Pages: II-1129-II-1132

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] Hidden semi-Markov model based speech synthesis2004

    • Author(s)
      Heiga Zen, Keiichi Tokuda, Takashi Masuko, Takao Kobayashi, Tadashi Kitamura
    • Journal Title

      International Conference on Spoken Language Processing (INTERSPEECH2004-ICSLP2004) vol.2

      Pages: II-1393-III-386

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] Deterministic annealing EM algorithm in parameter estimation for acoustic model2004

    • Author(s)
      Yohei Itaya, Heiga Zen, Yoshihiko Nankaku, Chiyomi Miyajima, Keiichi Tokuda, Tadashi Kitamura
    • Journal Title

      International Conference on Spoken Language Processing (INTERSPEECH2004-ICSLP2004) vol.1

      Pages: I-437-I-440

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] Activities of Interactive Speech Technology Consortium (ISTC) Targeting Open Software Development for MMI Systems2004

    • Author(s)
      T.Nitta, S.Sagayama, Y.Yamashita, T.Kawahara, S.Morishima, S.Nakamura, A.Yamada, K.Ito, M.Kai, A.Li, M.Mimura, K.Hirose, T.Kobayashi, K.Tokuda, N.Minematsu, Y.Den, T.Utsuro, T.Yotsukura, H.Shimodaira, M.Araki, T.Nishimoto, N.Kawaguchi, H.Banno, K.Katsurada
    • Journal Title

      13th IEEE International Workshop on Robot and Human Interactive Communication (RO-MAN 2004) (CD-ROM proceedings)

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] A Viterbi algorithm for a trajectory model derived from HMM with explicit relationship between static and dynamic features2004

    • Author(s)
      Heiga Zen, Keiichi Tokuda, Tadashi Kitamura
    • Journal Title

      Proceedings of 2004 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2004) vol.1

      Pages: 837-840

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] HMMジャスチャー認識の状態数の検討2004

    • Author(s)
      野村 健, 後藤富朗, 徳田恵一, 北村 正
    • Journal Title

      電子情報通信学会2004ソサイエティ大会講演論文集

      Pages: 97

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] 混合正規分布モデルを用いた調音運動に基づく音声合成2004

    • Author(s)
      戸田智基, Alan W.Black, 徳田恵一
    • Journal Title

      日本音響学会2004年秋季研究発表会講演論文集 vol.I

      Pages: 319-329

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] 発話内変動を考慮した最尤スペクトル変換法2004

    • Author(s)
      戸田智基, Alan W.Black, 徳田恵一
    • Journal Title

      日本音響学会2004年秋季研究発表会講演論文集 vol.I

      Pages: 329-330

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] Feature Extraction for speech recognition using Sparse KPCA2004

    • Author(s)
      Amaro Lima, Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, Tadashi Kitamura, Fernando Gil Resende
    • Journal Title

      日本音響学会2004年秋季研究発表会講演論文集 vol.I

      Pages: 69-70

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] On the use of kernel PCA for feature extraction in speech recognition2004

    • Author(s)
      Amaro Lima, Heiga Zen, Yoshihiko Nankaku, Chiyomi Miyajima, Keiichi Tokuda, Tadashi Kitamura
    • Journal Title

      IEICE Transactions on Information Systems vol.E87-D,no.12

      Pages: 2802-2811

  • [Journal Article] Reformulating the HMM as a Trajectory Model2004

    • Author(s)
      Keiichi Tokuda, Heiga Zen, Tadashi Kitamura
    • Journal Title

      Workshop on Statistical modeling Approach for Speech Recognition (Beyond HMM)

  • [Journal Article] An introduction of trajectory model into HMM-based speech synthesis2004

    • Author(s)
      Heiga Zen, Keiichi Tokuda, Tadashi Kitamura
    • Journal Title

      Proc. of 5th ISCA Speech Synthesis Workshop (CD-ROM proceedings)

  • [Journal Article] Mapping from articulatory movements to vocal tract spectrum with gaussian mixture model for articulatory speech synthesis2004

    • Author(s)
      Tomoki Toda, Alan W.Black, Keiichi Tokuda
    • Journal Title

      Proc. of 5th ISCA Speech Synthesis Workshop (CD-ROM proceedings)

  • [Journal Article] Parameter sharing and minimum classification error training of mixtures of actor analyzers for speaker identification2004

    • Author(s)
      Hiroyoshi Yamamoto, Yoshihoko Nankaku, Chiyomi Miyajima, Keiichi Tokuda, Tadashi Kitamura
    • Journal Title

      2004 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2004) vol.1

      Pages: 29-32

  • [Journal Article] 分離型2次元格子HMMに基づく音声認識の検討2004

    • Author(s)
      布目哲也, 南角吉彦, 徳田恵一, 北村正
    • Journal Title

      日本音響学会2004年秋季研究発表会講演論文集 vol.I

      Pages: 71-72

  • [Journal Article] 混合因子分析に基づく話者モデルの構造に関する検討2004

    • Author(s)
      山本啓善, 南角吉彦, 宮島千代美, 徳田恵一, 北村正
    • Journal Title

      日本音響学会2004年秋季研究発表会講演論文集 vol.I

      Pages: 95-96

  • [Journal Article] HMM歌声合成における楽譜情報を用いたラベル設計2004

    • Author(s)
      桑原宏明, 都筑亮介, 全炳河, 酒向慎司, 徳田恵一, 北村正
    • Journal Title

      日本音響学会2004年秋季研究発表会講演論文集 vol.I

      Pages: 323-324

  • [Journal Article] HMM音声合成器の小型化に関する検討2004

    • Author(s)
      森岡裕介, 片岡俊介, 全炳河, 南角吉彦, 徳田恵一, 北村正
    • Journal Title

      日本音響学会2004年秋季研究発表会講演論文集 vol.I

      Pages: 325-326

URL: 

Published: 2006-07-12   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi