• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実績報告書

統計的手法と生成過程モデリング手法の融合に基づく音声生成機能拡張技術の構築

研究課題

研究課題/領域番号 26280060
研究機関名古屋大学

研究代表者

戸田 智基  名古屋大学, 情報基盤センター, 教授 (90403328)

研究分担者 亀岡 弘和  日本電信電話株式会社NTTコミュニケーション科学基礎研究所, メディア情報研究部, 主任研究員/特別研究員 (20466402)
中村 哲  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (30263429)
猿渡 洋  東京大学, 情報理工学(系)研究科, 教授 (30324974)
研究期間 (年度) 2014-04-01 – 2017-03-31
キーワード機能拡張 / 音声合成 / 音声変換 / 信号処理 / 統計処理
研究実績の概要

音声コミュニケーションにおいて、物理的・身体的制約により生じる障壁を取り除くために、現存の音声生成過程において併用可能な音声変換基礎技術、および、音声生成機能を拡張する応用技術の構築を目指し、以下の課題に取り組んだ。
1.発声器官動作制御機能を備えた統計的音声変換技術の構築:調音動作操作機能を備えた統計的声質変換技術と、音源生成器官動作操作機能を備えた統計的韻律変換技術を併用することで、発声器官動作制御機能を備えた統計的音声変換技術を構築した。また、音声波形加工に基づく韻律変換手法や、高精度な音声特徴量時系列モデリング手法の改良に取り組んだ。
2.音声生成機能を拡張する複数の応用技術の構築:音声生成機能拡張技術として、発声障碍者補助技術、外国語発声生成技術、体内伝導音声強調技術、ボイスチェンジャー技術を構築し、その性能を評価した。発声障碍者補助技術については、短遅延予測処理に特化した手法を提案し、その有効性を示した。外国語発声生成技術に関しては、日本語話者の英語音声に対して、個人性を保持しつつ自然性を改善する手法を提案した。体内伝導音声強調技術については、統計的体内伝導音声強調処理部の前処理として適したを外部雑音除去技術を考案した。ボイスチェンジャーに関しては、提案技術に基づく変換システムを国際的評価会Voice Conversion Challenge 2016に投稿し、参加17機関中、最高性能の評価を得るに至った。
3.調音動作・音声同期収録データベースの構築:データベースの構築に向けて、前年度までに収録したデータの整備に取り組んだ。
4.これらの研究成果をとりまとめ、国内外において多数の研究発表を行った。本研究成果は高い評価を受け、国内において計4つの賞を受賞するとともに、8件の招待講演を実施するに至った。

現在までの達成度 (段落)

28年度が最終年度であるため、記入しない。

今後の研究の推進方策

28年度が最終年度であるため、記入しない。

次年度使用額が生じた理由

28年度が最終年度であるため、記入しない。

次年度使用額の使用計画

28年度が最終年度であるため、記入しない。

  • 研究成果

    (37件)

すべて 2017 2016

すべて 雑誌論文 (15件) (うち国際共著 2件、 査読あり 15件、 謝辞記載あり 14件、 オープンアクセス 7件) 学会発表 (22件) (うち国際学会 2件、 招待講演 8件)

  • [雑誌論文] Discriminative non-negative matrix factorization with majorization-minimization2017

    • 著者名/発表者名
      Li Li, Hirokazu Kameoka, Shoji Makino
    • 雑誌名

      Proceedings of HSCMA

      巻: - ページ: 141-145

    • 査読あり / 謝辞記載あり
  • [雑誌論文] A noise suppression method for body-conducted soft speech based on non-negative tensor factorization of air- and body-conducted signals2017

    • 著者名/発表者名
      Yusuke Tajiri, Hirokazu Kameoka, Tomoki Toda
    • 雑誌名

      Proceedings of ICASSP

      巻: - ページ: 4960-4964

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] はじめての音声変換2016

    • 著者名/発表者名
      戸田 智基
    • 雑誌名

      日本音響学会誌

      巻: 72 (6) ページ: 324-331

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Post-filters to modify the modulation spectrum for statistical parametric speech synthesis2016

    • 著者名/発表者名
      Shinnosuke Takamichi, Tomoki Toda, Alan W. Black, Graham Neubig, Sakriani Sakti, Satoshi Nakamura
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech and Language Processing

      巻: 24 (4) ページ: 755-767

    • DOI

      10.1109/TASLP.2016.2522655

    • 査読あり / 国際共著 / 謝辞記載あり
  • [雑誌論文] A statistical sample-based approach to GMM-based voice conversion using tied-covariance acoustic models2016

    • 著者名/発表者名
      Shinnosuke Takamichi, Tomoki Toda, Graham Neubig, Sakriani Sakti, Satoshi Nakamura
    • 雑誌名

      IEICE Transactions on Information and Systems

      巻: E99-D (10) ページ: 2490-2498

    • DOI

      10.1587/transinf.2016SLP0020

    • 査読あり
  • [雑誌論文] Improvements of voice timbre control based on perceived age in singing voice conversion2016

    • 著者名/発表者名
      Kazuhiro Kobayashi, Tomoki Toda, Tomoyasu Nakano, Masataka Goto, Satoshi Nakamura
    • 雑誌名

      IEICE Transactions on Information and Systems

      巻: E99-D (11) ページ: 2767-2777

    • DOI

      10.1587/transinf.2016EDP7234

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Non-native text-to-speech preserving speaker individuality based on partial correction of prosodic and phonetic characteristics2016

    • 著者名/発表者名
      Yuji Oshima, Shinnosuke Takamichi, Tomoki Toda, Graham Neubig, Sakriani Sakti, Satoshi Nakamura
    • 雑誌名

      IEICE Transactions on Information and Systems

      巻: E99-D (12) ページ: 3132-3139

    • DOI

      10.1587/transinf.2016EDP7231

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Reverberation-robust underdetermined source separation with non-negative tensor double deconvolution2016

    • 著者名/発表者名
      Naoki Murata, Hirokazu Kameoka, Keisuke Kinoshita, Shoko Araki, Tomohiro Nakatani, Shoichi Koyama, Hiroshi Saruwatari
    • 雑誌名

      Proceedings of EUSIPCO

      巻: - ページ: 1648-1652

    • DOI

      10.1109/EUSIPCO.2016.7760528

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Real-time vibration control of an electrolarynx based on statistical F0 contour prediction2016

    • 著者名/発表者名
      Kou Tanaka, Tomoki Toda, Graham Neubig, Satoshi Nakamura
    • 雑誌名

      Proceedigns of EUSIPCO

      巻: - ページ: 1333-1337

    • DOI

      10.1109/EUSIPCO.2016.7760465

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Acoustic-to-articulatory inversion mapping based on latent trajectory Gaussian mixture model2016

    • 著者名/発表者名
      Patrick Lumban Tobing, Tomoki Toda, Hirokazu Kameoka, Satoshi Nakamura
    • 雑誌名

      Proceedings of INTERSPEECH

      巻: - ページ: 953-957

    • DOI

      10.21437/Interspeech.2016-1196

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] The Voice Conversion Challenge 20162016

    • 著者名/発表者名
      Tomoki Toda, Ling-Hui Chen, Daisuke Saito, Fernando Villavicencio, Mirjam Wester, Zhizheng Wu, Junichi Yamagishi
    • 雑誌名

      Proceedings of INTERSPEECH

      巻: - ページ: 1632-1636

    • DOI

      10.21437/Interspeech.2016-1066

    • 査読あり / オープンアクセス / 国際共著 / 謝辞記載あり
  • [雑誌論文] The NU-NAIST voice conversion system for the Voice Conversion Challenge 20162016

    • 著者名/発表者名
      Kazuhiro Kobayashi, Shinnosuke Takamichi, Satoshi Nakamura, Tomoki Toda
    • 雑誌名

      Proceedings of INTERSPEECH

      巻: - ページ: 1667-1671

    • DOI

      10.21437/Interspeech.2016-970

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] Semi-supervised joint enhancement of spectral and cepstral sequences of noisy speech2016

    • 著者名/発表者名
      Li Li, Hirokazu Kameoka, Takuya Higuchi, Hiroshi Saruwatari
    • 雑誌名

      Proceedings of INTERSPEECH

      巻: - ページ: 3753-3757

    • DOI

      10.21437/Interspeech.2016-1286

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] Nonaudible murmur enhancement based on statistical voice conversion and noise suppression with external noise monitoring2016

    • 著者名/発表者名
      Yusuke Tajiri, Tomoki Toda
    • 雑誌名

      Proceedings of 9th ISCA Speech Synthesis Workshop (SSW9)

      巻: - ページ: 54-60

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] F0 transformation techniques for statistical voice conversion with direct waveform modification with spectral differential2016

    • 著者名/発表者名
      Kazuhiro Kobayashi, Tomoki Toda, Satoshi Nakamura
    • 雑誌名

      Proceedings of SLT

      巻: - ページ: 693-700

    • DOI

      10.1109/SLT.2016.7846338

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [学会発表] F0パターン生成過程の確率モデルに基づく電気音声に対するフレーズ・アクセント指令推定2017

    • 著者名/発表者名
      田中 宏, 亀岡 弘和, 戸田 智基, 中村 哲
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      明治大学(神奈川県川崎市)
    • 年月日
      2017-03-15 – 2017-03-17
  • [学会発表] Acoustic-to-articulatory inversion mapping with variational latent trajectory Gaussian mixture model2017

    • 著者名/発表者名
      Patrick Lumban Tobing, Hirokazu Kameoka, Tomoki Toda
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      明治大学(神奈川県川崎市)
    • 年月日
      2017-03-15 – 2017-03-17
  • [学会発表] 差分スペクトル補正に基づく声質変換におけるF0変換法の調査2017

    • 著者名/発表者名
      小林 和弘, 戸田 智基, 中村 哲
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      明治大学(神奈川県川崎市)
    • 年月日
      2017-03-15 – 2017-03-17
  • [学会発表] 統計的音声波形変換に基づく雑音環境下における音声了解度向上2017

    • 著者名/発表者名
      武山 知弘, 小林 和弘, 田尻 祐介, 戸田 智基, 武田 一哉
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      明治大学(神奈川県川崎市)
    • 年月日
      2017-03-15 – 2017-03-17
  • [学会発表] 音声器官動作操作機能を備えた統計的音声変換法の評価2017

    • 著者名/発表者名
      伊佐 衣代, Patrick Lumban Tobing, 田中 宏, 戸田 智基, 中村 哲
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      明治大学(神奈川県川崎市)
    • 年月日
      2017-03-15 – 2017-03-17
  • [学会発表] 非可聴つぶやき強調のためのセグメント特徴量正則化NTF2017

    • 著者名/発表者名
      田尻 祐介, 亀岡 弘和, 戸田 智基
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      明治大学(神奈川県川崎市)
    • 年月日
      2017-03-15 – 2017-03-17
  • [学会発表] 音声信号の分析と加工 ― 音声を自在に変換するには?2017

    • 著者名/発表者名
      戸田 智基
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      明治大学(神奈川県川崎市)
    • 年月日
      2017-03-15 – 2017-03-17
    • 招待講演
  • [学会発表] 補助関数法による識別的NMF の基底学習アルゴリズム2017

    • 著者名/発表者名
      李莉, 亀岡弘和, 牧野昭二
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      明治大学(神奈川県川崎市)
    • 年月日
      2017-03-15 – 2017-03-17
  • [学会発表] Vocal Tract Spectrogram Estimation with Formant Frequency Contour Factorization2017

    • 著者名/発表者名
      鄒雲漢, 李莉, 亀岡弘和
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      明治大学(神奈川県川崎市)
    • 年月日
      2017-03-15 – 2017-03-17
  • [学会発表] 音声変換技術の進展と課題2017

    • 著者名/発表者名
      戸田 智基
    • 学会等名
      日本音響学会東海支部総会・講演会
    • 発表場所
      ルブラ王山(愛知県名古屋市)
    • 年月日
      2017-03-13 – 2017-03-13
    • 招待講演
  • [学会発表] セグメント特徴量正則化NTFに基づく雑音環境下における非可聴つぶやき強調2017

    • 著者名/発表者名
      田尻 祐介, 亀岡 弘和, 戸田 智基
    • 学会等名
      電子情報通信学会/日本音響学会 音声研究会
    • 発表場所
      沖縄産業支援センター(沖縄県那覇市)
    • 年月日
      2017-03-01 – 2017-03-02
  • [学会発表] Acoustic-to-articulatory inversion mapping with variational latent trajectory Gaussian mixture model2017

    • 著者名/発表者名
      Patrick Lumban Tobing, Hirokazu Kameoka, Tomoki Toda
    • 学会等名
      電子情報通信学会/日本音響学会 音声研究会
    • 発表場所
      沖縄産業支援センター(沖縄県那覇市)
    • 年月日
      2017-03-01 – 2017-03-02
  • [学会発表] Low delay statistical singing voice conversion with direct waveform modification based on spectral differential considering global variance2016

    • 著者名/発表者名
      Kazuhiro Kobayashi, Tomoki Toda, Satoshi Nakamura
    • 学会等名
      5th Joint Meeting of the ASA and the ASJ
    • 発表場所
      Hilton Hawaiian Village (Honolulu, Hawaii, USA)
    • 年月日
      2016-11-28 – 2016-12-02
    • 国際学会
  • [学会発表] Evaluation of electrolarynx controlled by real-time statistical F0 prediction2016

    • 著者名/発表者名
      Kou Tanaka, Tomoki Toda, Satoshi Nakamura
    • 学会等名
      5th Joint Meeting of the ASA and the ASJ
    • 発表場所
      Hilton Hawaiian Village (Honolulu, Hawaii, USA)
    • 年月日
      2016-11-28 – 2016-12-02
    • 国際学会
  • [学会発表] Statistical voice conversion and its application to augmented speech production2016

    • 著者名/発表者名
      Tomoki Toda
    • 学会等名
      名古屋工業大学情報科学フロンティア研究院特別講演会
    • 発表場所
      名古屋工業大学(愛知県名古屋市)
    • 年月日
      2016-11-18 – 2016-11-18
    • 招待講演
  • [学会発表] トラジェクトリ隠れマルコフモデルによる音声強調2016

    • 著者名/発表者名
      岸田拓也, 亀岡弘和, 中島祥好
    • 学会等名
      日本音響学会秋季研究発表会
    • 発表場所
      富山大学(富山県富山市)
    • 年月日
      2016-09-14 – 2016-09-16
  • [学会発表] 統計的音響信号処理2016

    • 著者名/発表者名
      亀岡弘和
    • 学会等名
      NLP若手の会(YANS)第11回シンポジウム
    • 発表場所
      ホテルシーモア(和歌山県西牟婁郡)
    • 年月日
      2016-08-28 – 2016-08-30
    • 招待講演
  • [学会発表] 音声のスペクトル領域とケプストラム領域における同時強調2016

    • 著者名/発表者名
      李莉, 亀岡弘和, 樋口卓哉, 猿渡洋, 牧野昭二
    • 学会等名
      電子情報通信学会/日本音響学会 音声研究会
    • 発表場所
      京都大学(京都府京都市)
    • 年月日
      2016-08-17 – 2016-08-17
  • [学会発表] 音情報処理における特徴表現2016

    • 著者名/発表者名
      戸田智基
    • 学会等名
      MIRU2016 第19回画像の認識・理解シンポジウム, 特別企画MIRU x KIKU(音学シンポジウム連携オーガナイズドセッション)
    • 発表場所
      アクトシティ浜松(静岡県浜松市)
    • 年月日
      2016-08-01 – 2016-08-04
    • 招待講演
  • [学会発表] 音響信号の分解と再構成2016

    • 著者名/発表者名
      亀岡弘和
    • 学会等名
      MIRU2016 第19回画像の認識・理解シンポジウム, 特別企画MIRU x KIKU(音学シンポジウム連携オーガナイズドセッション)
    • 発表場所
      アクトシティ浜松(静岡県浜松市)
    • 年月日
      2016-08-01 – 2016-08-04
    • 招待講演
  • [学会発表] 音情報処理における特徴表現2016

    • 著者名/発表者名
      戸田智基
    • 学会等名
      情報処理学会 音楽情報科学研究会 音学シンポジウム2016(第111回研究発表会), MIRU連携オーガナイズドセッション
    • 発表場所
      東海大学高輪キャンパス(東京都港区)
    • 年月日
      2016-05-21 – 2016-05-22
    • 招待講演
  • [学会発表] 音響信号の分解と再構成2016

    • 著者名/発表者名
      亀岡弘和
    • 学会等名
      情報処理学会 音楽情報科学研究会 音学シンポジウム2016(第111回研究発表会), MIRU連携オーガナイズドセッション
    • 発表場所
      東海大学高輪キャンパス(東京都港区)
    • 年月日
      2016-05-21 – 2016-05-22
    • 招待講演

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi