2002 Fiscal Year Annual Research Report
多様な声質を実現する音声合成のための自動ボイスビルダー
Project/Area Number |
14380160
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
徳田 恵一 名古屋工業大学, 工学部, 助教授 (20217483)
|
Co-Investigator(Kenkyū-buntansha) |
益子 貴史 東京工業大学, 大学院・総合理工学研究科, 助手 (90272715)
小林 隆夫 東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)
北村 正 名古屋工業大学, 工学部, 教授 (60114865)
|
Keywords | 音声合成 / 声質 / 感情音声 / HMM音声合成 / ラベリング / 自動ボイスビルディング / PLEd |
Research Abstract |
本研究は,「自動ボイスビルディング」(Automatic Voice Building)という新たな枠組みを確立し,多様な声質や発話様式の音声を生成可能な音声合成システムを自動構築するための技術を開拓しようとするものである.このためには,音声データベースに,アクセント,品詞,活用形,活用形,文構造,読み,発音,更には,単語に対するフォーカス,発話様式など自動的に付与することが必要となるが,これらの情報は,お互いに何らかの相互関係をもっているため,独立に取り扱った場合には,データの不整合を引き起こし,人手でこれを修復することは困難となる.このような言語情報ファイルの編集作業が,大量の音声データを学習に投入するための障害となっていた.本年度は,この問題を解決するため,ラベリン作業を効率的に行う手法とそのためのソフトウェアツールの開発を主眼においた.経過は,以下のとおりである. 1.韻律・言語情報編集ツールを完成させた. 2.実際に,音声データベースに対するラベル付けを行い,問題点を洗い出した.特に,付与作業の参加者に対する聞き取り調査を行い,作業の効率化に必要な条件を明らかにした. 3.開発した韻律・言語情報編集ツールにより,大量の音声データベースにラベル付けを行った. 4.ラベル自動付与を目指し,アクセント情報の自動付与手法に関する予備実験を行った.
|
Research Products
(33 results)
-
[Publications] 川本真一: "擬人化音声対話エージェントの構築"情報処理学会論文誌. vol.43,no.7. 2249-2263 (2002)
-
[Publications] 酒向慎司: "HMMに基づいた視聴覚テキスト音声合成--画像ベースアプローチ"情報処理学会論文誌. vol.43,no.7. 1382-1391 (2002)
-
[Publications] 田村正統: "HMMに基づく音声合成におけるピッチ・スペクトルの話者適応"電子応報通信学会論文誌. vol.J85-D-11,no.4. 545-553 (2002)
-
[Publications] Junichi Yamagishi: "A training method for average voice model based on shared decision tree context clustering and speaker adaptive training"Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing. vol.1. 716-719 (2003)
-
[Publications] Hiroyuki Suzuki: "Speech recognition using voice-characteristic-dependent acoustic models"Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing. vol.1. 740-743 (2003)
-
[Publications] Keiichi Tokuda: "An HMM-based speech synthesis system applied to English"2002 IEEE Speech Synthesis Workshop. (CD-ROM). (2002)
-
[Publications] Shin-ichi Kawamoto: "Open-source Software for Developing Anthropomorphic Spoken Dialog Agents"International Workshop on LIFELIKE ANIMATED AGENTS Tools, Affective Functions, and Applications. 64-69 (2002)
-
[Publications] Jun-ichi Yamagishi: "A context clustering technique for average voice model in HMM-based speech synthesis"8th International Conference on Spoken Language Processing. 133-136 (2002)
-
[Publications] Kengo Shichiri: "Eigenvoices for HMM-based speech synthesis"8th International Conference on Spoken Language Processing. 1269-1272 (2002)
-
[Publications] Heiga Zen: "Decision tree distribution tying based on a dimensional split technique"8th International Conference on Spoken Language Processing. 1257-1260 (2002)
-
[Publications] Shin-ichi Kawamoto: "Freeware for developments of anthropomorphic dialog agent"Third International Conference on Language Resources and Evaluation. (CD-ROM). (2002)
-
[Publications] 嵯峨山茂樹: "擬人化音声対話エージェントツールキットGalatea"情報処理学会研究報告. vol.2003. 57-64 (2003)
-
[Publications] 山岸順一: "平均声モデル構築におけるコンテキストクラスタリングと話者適応学習の検討"電子情報通信学会技術研究報告. vol.102,no.292. 5-10 (2002)
-
[Publications] 川本 真一: "カスタマイズが容易な擬人化音声対話エージェント"Interaction2002. (CD-ROM). 61-62 (2002)
-
[Publications] 川本真一: "擬人化音声対話エージェントツールキットの基本設計"情報処理学会研究報告. vol.2002,no.10. 61-66 (2002)
-
[Publications] 七里建吾: "固有声手法を用いたHMMに基づく任意の声質合成システムの検討"日本音響学会2003年秋季研究発表会講演論文集. vol.I. 275-276 (2003)
-
[Publications] 江本喜久男: "自動ラベリングのためのMSD-HMMを用いたアクセント型認識"日本音響学会2003年秋季研究発表会講演論文集. vol.I. 369-370 (2003)
-
[Publications] 水谷伸晃: "HMMに基づいた単位接続型音声合成における継続長コストの導入"日本音響学会2003年秋季研究発表会講演論文集. vol.I. 245-246 (2003)
-
[Publications] 都築亮介: "HMM音声合成における感情表現のモデル化に関する検討"日本音響学会2003年秋季研究発表会講演論文集. vol.I. 269-270 (2003)
-
[Publications] 岸本由加: "HMM音声合成のためのポストフィルタ係数の自動決定"日本音響学会2003年秋季研究発表会講演論文集. vol.I. 243-244 (2003)
-
[Publications] 片岡俊介: "HMM音声合成における決定木のバックオフによる品質改善の検討"日本音響学会2003年秋季研究発表会講演論文集. vol.I. 239-240 (2003)
-
[Publications] 板谷洋平: "DAEMアルゴリズムを用いた話者認識のためのGMM学習法"日本音響学会2003年秋季研究発表会講演論文集. vol.I. 115-116 (2003)
-
[Publications] 全炳河: "動的特徴量を含んだHMMより導出されるトラジェクトリモデル"日本音響学会2003年秋季研究発表会講演論文集. vol.I. 13-14 (2003)
-
[Publications] 全炳河: "言語モデルからの文生成による音声合成コーパス用テキスト設計の検討"日本音響学会2003年秋季研究発表会講演論文集. vol.I. 257-258 (2003)
-
[Publications] 徳田恵一: "律生成HMMのための学習データ作成ツール"日本音響学会2003年秋季研究発表会講演論文集. vol.I. 259-260 (2003)
-
[Publications] 山岸順一: "話者適応のための平均声モデル学習法の検討"日本音響学会2002年秋季研究発表会講演論文集. vol.I. 351-352 (2002)
-
[Publications] Keiichi Tokuda: "HMM-based approach to English speech synthesis"日本音響学会2002年秋季研究発表会講演論文集. vol.I. 357-358 (2002)
-
[Publications] 七里建吾: "固有声を用いたHMM音声合成における声質評価の検討"日本音響学会2002年秋季研究発表会講演論文集. vol.I. 359-360 (2002)
-
[Publications] 全炳河: "決定木による音素コンテキスト・次元・状態位置の同時クラスタリング"日本音響学会2002年秋季研究発表会講演論文集. vol.I. 39-40 (2002)
-
[Publications] 水谷伸晃: "HMMに基づいた単位接続型音声合成"日本音響学会2002年秋季研究発表会講演論文集. vol.I. 241-242 (2002)
-
[Publications] 鈴木浩之: "声質を考慮した音響モデルによる音声認識"日本音響学会2002年秋季研究発表会講演論文集. vol.I. 37-38 (2002)
-
[Publications] 岸本由加: "HMM音声合成のためのポストフィルタリング"日本音響学会2002年秋季研究発表会講演論文集. vol.I. 279-280 (2002)
-
[Publications] 石川ちさと: "HMM歌声合成における音韻・音高の同時モデル化"第1回情報科学技術フォーラムForum on Information Technology (FIT2002). 237-238 (2002)