1999 Fiscal Year Annual Research Report
Project/Area Number |
10555125
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
小林 隆夫 東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)
|
Co-Investigator(Kenkyū-buntansha) |
益子 貴史 東京工業大学, 大学院・総合理工学研究科, 助手 (90272715)
徳田 恵一 名古屋工業大学, 工学部, 助教授 (20217483)
|
Keywords | 音声合成 / 隠れマルコフモデル / テキスト解析 / MSLRパーザ |
Research Abstract |
本研究では,音声の統計モデルとして音声認識の分野で広く用いられている隠れマルコフモデルに基づいて,任意のテキストから多様な声質や感情を含む様々な発話形式を表現することのできる音声合成システムを実現することを目的としている。任意のテキストから音声を合成するためには,任意の文章から音素列,アクセント型,形態素,アクセント句境界などを求めるテキスト解析部と,テキスト解析の結果得られたラベル列から音声を合成する音声合成部を構築する必要があり,本年度はテキスト解析部と音声合成部のそれぞれについて検討を行った。 テキスト解析を行う際には,形態素解析,構文解析,アクセント・読み情報の付与などを実現する必要がある。そこで,まず一般に公開されている自然言語処理ツールを用いた場合のテキスト解析の性能と合成音声の品質について予備的な検討を行った。その結果,テキスト解析に形態素・構文解析システムであるMSLRパーザを利用し,アクセントおよび読み情報をEDR日本語単語辞書から求めた場合,MSLRに付属する単語辞書中,発音情報を付加できたものが96.5%,その中で発音が一意に決まらないレコード数は4.8%となった。このテキスト解析部を音声合成部と組み合わせて非公式な受聴を行ったところ,任意の文章からの合成音声においても,自然な韻律を持つ音声を合成できることを確認できた。さらに,音声合成に使用する音声単位を,HMMに基づいてスペクトル・ピッチ・状態継続長を同時にモデル化する新たな手法を提案し,自然性の高い合成音声を生成できることを示した。 今後の課題として,テキスト解析部の性能の向上,音声合成に適したテキスト解析手法の検討,多様な声質,発話スタイルで音声を合成するシステムの構築が挙げられる。
|
-
[Publications] T.Yoshimura,K.Tokuda,T.Masuko,T.Kobayashi,T.Kitamura: "Simultaneous modeling of spectrum,pitch and duration in HMM-based speech synthesis"Proc.6th European Conference on Speech Communication and Technology,EUROSPEECH'99. EUROSPEECH-99・5. 2347-2350 (1999)
-
[Publications] 吉村 貴克,徳田 恵一,益子 貴史,小林 隆夫,北村 正: "HMMに基づく音声合成におけるスペクトル・ピッチ・状態継続長の同時モデル化"電子情報通信学会技術研究報告(SP). 99・255. 33-38 (1999)
-
[Publications] 吉村 貴克,徳田 恵一,益子 貴史,小林 隆夫,北村 正: "HMMに基づく音声合成のためのスペクトラム,ピッチ,状態継続長のモデル化"日本音響学会平成11年度春季研究発表会講演論文集. 241-242 (1999)
-
[Publications] 田村 正統,益子 貴史,徳田 恵一,小林 隆夫: "MLLRおよびMAP/VFSを用いたHMM音声合成における話者適応"日本音響学会平成11年度春季研究発表会講演論文集. 243-244 (1999)
-
[Publications] 一ツ松 孝文,益子 貴史,小林 隆夫,徳田 恵一: "合成音声を用いたテキスト指定型話者照合システムにおける詐称の検討"日本音響学会平成11年度春季研究発表会講演論文集. 265-266 (1999)
-
[Publications] 吉村 貴克,徳田 恵一,益子 貴史,小林 隆夫,北村 正: "HMMに基づくピッチパターン生成における動的特徴量の効果"日本音響学会平成11年度秋季研究発表会講演論文集. 215-216 (1999)