• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実績報告書

バリアフリー音声コミュニケーションのための次世代ボイスチェンジャー技術の構築

研究課題

研究課題/領域番号 22680016
研究機関奈良先端科学技術大学院大学

研究代表者

戸田 智基  奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90403328)

研究期間 (年度) 2010-04-01 – 2014-03-31
キーワード音声情報処理 / 音声信号処理 / 音声合成 / 声質変換 / 声質制御 / リアルタイム処理 / 自動適応 / バリアフリー
研究概要

リアルタイムで声質変換・制御できる次世代ボイスチェンジャー技術とその応用技術の構築を目指し、実施計画1)各要素技術の改善と、実施計画2)各要素技術の統合による次世代ボイスチェンジャー技術とその応用技術の改善に取り組んだ。
1)各要素技術の改善:基盤技術を改善するために、変換スペクトルに対する変調スペクトルに基づくポストフィルタを提案し、その有効性を示した。また、変換モデルの学習/評価尺度を改善するために、許容スペクトル変換誤差予測モデルを構築した。さらに、ディジタルシグナルプロセッサ(DSP)上でのリアルタイム変換処理の実装に成功した。
2)次世代ボイスチェンジャー技術とその応用技術の改善:各要素技術を統合し、音声生成機能拡張のためのリアルタイム変換技術を構築した。また、応用技術として、A)発声障害者補助のための電気音声強調、B)周囲に迷惑をかけないサイレント音声強調、C)任意の歌手の声質による歌唱を実現する歌声用ボイスチェンジャーの各々に対し、さらなる性能改善を行った。A)電気音声強調においては、ハイブリッド強調法の改善に取り組んだ。さらに、対面会話でも使用できるシステムとして、電気式人工喉頭の出力音源制御技術を構築した。B)サイレント音声強調においては、実環境への適用を目指し、雑音環境下にいる聞き手にも聞き取りやすい変換音声の調査に取り組んだ。その結果、適切な目標音声は、雑音レベルに応じて変化することを示した。C)歌声用ボイスチェンジャーにおいては、知覚年齢制御技術の改善に取り組んだ。歌手の個人性を保持したまま、知覚年齢を手動制御する手法を提案し、その有効性を示した。さらに、差分スペクトルに基づく変換処理を提案し、変換歌声の品質を改善した。
本研究成果は高い評価を受け、国際/国内会議において招待講演を2回行い、計2つの国内学会発表賞を受賞した。

現在までの達成度 (区分)
理由

25年度が最終年度であるため、記入しない。

今後の研究の推進方策

25年度が最終年度であるため、記入しない。

  • 研究成果

    (26件)

すべて 2014 2013 その他

すべて 雑誌論文 (10件) (うち査読あり 8件) 学会発表 (15件) (うち招待講演 1件) 産業財産権 (1件)

  • [雑誌論文] Alaryngeal speech enhancement based on one-to-many eigenvoice conversion2014

    • 著者名/発表者名
      Hironori Doi, Tomoki Toda, 他
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech and Language Processing

      巻: Vol.22, No.1 ページ: 172-183

    • DOI

      10.1109/TASLP.2013.2286917

  • [雑誌論文] Voice timbre control based on perceived age in singing voice conversion2014

    • 著者名/発表者名
      Kazuhiro Kobayashi, Tomoki Toda, Hironori Doi, Tomoyasu Nakano, Masataka Goto, Graham Neubig, Sakriani Sakti, Satoshi Nakamura
    • 雑誌名

      IEICE Transactions on Information and Systems

      巻: E97-D(6) ページ: 印刷中

    • 査読あり
  • [雑誌論文] A hybrid approach to electrolaryngeal speech enhancement based on noise reduction and statistical excitation generation2014

    • 著者名/発表者名
      Kou Tanaka, Tomoki Toda, Graham Neubig, Sakriani Sakti, Satoshi Nakamura
    • 雑誌名

      IEICE Transactions on Information and Systems

      巻: E97-D(6) ページ: 印刷中

    • 査読あり
  • [雑誌論文] 周囲が聞き取れない程の小声を鮮明音声にする変換技術の開発2013

    • 著者名/発表者名
      戸田 智基
    • 雑誌名

      エヌ・ティー・エス 次世代ヒューマンインタフェース開発最前線

      巻: なし ページ: 227~236

  • [雑誌論文] An investigation of acoustic features for singing voice conversion based on perceptual age2013

    • 著者名/発表者名
      Kazuhiro Kobayashi, Hironori Doi, Tomoki Toda, Tomoyasu Nakano, Masataka Goto, Graham Neubig, Sakriani Sakti, Satoshi Nakamura
    • 雑誌名

      Proceedings of INTERSPEECH

      巻: なし ページ: 1057~1061

    • 査読あり
  • [雑誌論文] Evaluation of a singing voice conversion method based on many-to-many eigenvoice conversion2013

    • 著者名/発表者名
      Hironori Doi, Tomoki Toda, Tomoyasu Nakano, Masataka Goto, Satoshi Nakamura
    • 雑誌名

      Proceedings of INTERSPEECH

      巻: なし ページ: 1067~1071

    • 査読あり
  • [雑誌論文] Hybrid approach to electrolaryngeal speech enhancement based on spectral subtraction and statistical voice conversion2013

    • 著者名/発表者名
      Kou Tanaka, Tomoki Toda, Graham Neubig, Sakriani Sakti, Satoshi Nakamura
    • 雑誌名

      Proceedings of INTERSPEECH

      巻: なし ページ: 3067~3071

    • 査読あり
  • [雑誌論文] A digital signal processor implementation of silent/electrolaryngeal speech enhancement based on real-time statistical voice conversion2013

    • 著者名/発表者名
      Takuto Moriguchi, Tomoki Toda, Motoaki Sano, Hiroshi Sato, Graham Neubig, Sakriani Sakti, Satoshi Nakamura
    • 雑誌名

      Proceedings of INTERSPEECH

      巻: なし ページ: 3072~3076

    • 査読あり
  • [雑誌論文] Investigation of intra-speaker spectral parameter variation and its prediction towards improvement of spectral conversion metric2013

    • 著者名/発表者名
      Tatsuo Inukai, Tomoki Toda, Graham Neubig, Sakriani Sakti, Satoshi Nakamura
    • 雑誌名

      Proceedings of 8th ISCA Speech Synthesis Workshop (SSW8)

      巻: なし ページ: 89~94

    • 査読あり
  • [雑誌論文] Statistical voice conversion techniques for alaryngeal speech enhancement2013

    • 著者名/発表者名
      Tomoki Toda, Hironori Doi
    • 雑誌名

      Proceedings of SICE 2013

      巻: なし ページ: 1602~1603

    • 査読あり
  • [学会発表] 差分スペクトル補正に基づく統計的歌声声質変換2014

    • 著者名/発表者名
      小林 和弘, 戸田 智基, Neubig Graham, Sakti Sakriani, 中村 哲
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      日本大学(東京都千代田区)
    • 年月日
      20140310-20140312
  • [学会発表] 雑音環境下での非可聴つぶやき強調システムにおける目標音声の評価2014

    • 著者名/発表者名
      鶴田 さくら, 田中 宏, 戸田 智基, Neubig Graham, Sakti Sakriani, 中村 哲
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      日本大学(東京都千代田区)
    • 年月日
      20140310-20140312
  • [学会発表] 音声入力による韻律制御機能を有するHMM音声合成システム2014

    • 著者名/発表者名
      西垣 友理, 高道 慎之介, 戸田 智基, Neubig Graham, Sakti Sakriani, 中村 哲
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      日本大学(東京都千代田区)
    • 年月日
      20140310-20140312
  • [学会発表] 統計的音源予測に基づく電気式人工喉頭制御法2014

    • 著者名/発表者名
      田中 宏, 戸田 智基, Neubig Graham, Sakti Sakriani, 中村 哲
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      日本大学(東京都千代田区)
    • 年月日
      20140310-20140312
  • [学会発表] 統計的歌声声質変換における知覚年齢に基づく声質制御2013

    • 著者名/発表者名
      小林 和弘, 戸田 智基, Graham Neubig, Sakriani Sakti, 中村 哲
    • 学会等名
      電子情報通信学会音声研究会
    • 発表場所
      奈良先端科学技術大学院大学(奈良県生駒市)
    • 年月日
      20131121-20131122
  • [学会発表] ハイブリッド式電気音声強調法における音源特徴量予測の評価2013

    • 著者名/発表者名
      田中 宏, 戸田 智基, Graham Neubig, Sakriani Sakti, 中村 哲
    • 学会等名
      電子情報通信学会音声研究会
    • 発表場所
      奈良先端科学技術大学院大学(奈良県生駒市)
    • 年月日
      20131121-20131122
  • [学会発表] HMM音声合成における変調スペクトルに基づくポストフィルタ2013

    • 著者名/発表者名
      高道 慎之介, 戸田 智基, Graham Neubig, Sakriani Sakti, 中村 哲
    • 学会等名
      電子情報通信学会音声研究会
    • 発表場所
      奈良先端科学技術大学院大学(奈良県生駒市)
    • 年月日
      20131121-20131122
  • [学会発表] 変調スペクトルを考慮したHMM音声合成2013

    • 著者名/発表者名
      高道 慎之介, 戸田 智基, Graham Neubig, Sakriani Sakti, 中村 哲
    • 学会等名
      日本音響学会秋季研究発表会
    • 発表場所
      豊橋技術科学大学(愛知県豊橋市)
    • 年月日
      20130925-20130927
  • [学会発表] 統計的手法に基づくリアルタイム声質変換による音声生成機能拡張2013

    • 著者名/発表者名
      戸田 智基
    • 学会等名
      日本音響学会秋季研究発表会
    • 発表場所
      豊橋技術科学大学(愛知県豊橋市)
    • 年月日
      20130925-20130927
    • 招待講演
  • [学会発表] ハイブリッド電気音声強調法における音源特徴量予測2013

    • 著者名/発表者名
      田中 宏, 戸田 智基, Graham Neubig, Sakriani Sakti, 中村 哲
    • 学会等名
      日本音響学会秋季研究発表会
    • 発表場所
      豊橋技術科学大学(愛知県豊橋市)
    • 年月日
      20130925-20130927
  • [学会発表] 統計的歌声声質変換における知覚年齢に沿った声質制御2013

    • 著者名/発表者名
      小林 和弘, 戸田 智基, Graham Neubig, Sakriani Sakti, 中村 哲
    • 学会等名
      日本音響学会秋季研究発表会
    • 発表場所
      豊橋技術科学大学(愛知県豊橋市)
    • 年月日
      20130925-20130927
  • [学会発表] スペクトル補正及び統計的音源生成に基づくハイブリッド電気音声強調2013

    • 著者名/発表者名
      田中 宏, 戸田 智基, Graham Neubig, Sakriani Sakti, 中村 哲
    • 学会等名
      電子情報通信学会音声研究会
    • 発表場所
      新潟大学(新潟県新潟市)
    • 年月日
      20130613-20130614
  • [学会発表] 知覚年齢に沿った歌声声質制御のための音響特徴量の調査2013

    • 著者名/発表者名
      小林 和弘, 土井 啓成, 戸田 智基, 中野 倫靖, 後藤 真孝, Graham Neubig, Sakriani Sakti, 中村 哲
    • 学会等名
      情報処理学会音楽情報科学研究会
    • 発表場所
      お茶の水女子大学(東京都文京区)
    • 年月日
      20130511-20130512
  • [学会発表] 歌声声質変換における歌手の知覚年齢制御法

    • 著者名/発表者名
      小林 和弘, 戸田 智基, Graham Neubig, Sakriani Sakti, 中村 哲
    • 学会等名
      第16回日本音響学会関西支部若手研究者交流研究発表会
    • 発表場所
      産業総合技術研究所(大阪府和泉市)
  • [学会発表] スペクトル補正及び統計的音源生成に基づくハイブリッドな電気音声強調法

    • 著者名/発表者名
      田中 宏, 戸田 智基, Graham Neubig, Sakriani Sakti, 中村 哲
    • 学会等名
      第16回日本音響学会関西支部若手研究者交流研究発表会
    • 発表場所
      産業総合技術研究所(大阪府和泉市)
  • [産業財産権] 電気式人工喉頭装置2013

    • 発明者名
      戸田 智基、田中 宏、他
    • 権利者名
      戸田 智基、田中 宏、他
    • 産業財産権種類
      特許
    • 産業財産権番号
      2013-165087
    • 出願年月日
      2013-08-08

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi