• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実施状況報告書

雑音環境下で頑健に動作するサイレント音声通話技術の構築

研究課題

研究課題/領域番号 15K12064
研究機関名古屋大学

研究代表者

戸田 智基  名古屋大学, 情報基盤センター, 教授 (90403328)

研究分担者 中村 哲  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (30263429) [辞退]
サクリアニ サクティ  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (00395005) [辞退]
Neubig Graham  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (70633428) [辞退]
研究期間 (年度) 2015-04-01 – 2018-03-31
キーワードサイレント音声 / 音声合成 / 音声変換 / 信号処理 / 統計処理
研究実績の概要

周囲に聴取困難なほど微弱なささやき声によるサイレント音声コミュニケーションの実環境下への適用を目指し,外部雑音に対して頑健に動作するサイレント音声通話技術の研究開発に取り組んだ。
1.外部雑音モニタリングを用いた雑音抑圧技術の改善:前年度構築した独立成分分析に基づくセミブラインド音源分離に基づく雑音抑圧技術の性能評価を行い、複数音源や移動音源が外部雑音として存在する際には、十分な抑圧性能が得られないことを示した。また、このような条件下でも雑音抑圧を可能とするために、外部雑音モニタリングの制約を活用した非負値テンソル因子分解に基づく雑音抑圧技術を提案した。
2.外部雑音変化に伴う発話様式変化および音響特徴量変化への対応:外部雑音変化に伴う発話様式変化(ロンバード効果)が生じている音声データに対して、外部雑音モニタリングを用いた雑音抑圧技術の性能評価を行い、発話様式変化に対して頑健に動作することを明らかにした。一方で、体内伝導音声の音響特徴量変化が、後段の統計的体内伝導音声強調処理に悪影響を与えることを明らかにした。
3.上記の問題に対処するため、統計的音声強調処理に適した雑音抑圧処理手法を提案し、その有効性を示した(次年度の研究計画を前倒しで実施)。また、体内伝導音声認識システムの構築も行った(追加で実施)。
4.雑音環境下における変換音声の明瞭性改善:前年度前倒しで実施した研究内容に加え、さらに、変換目標となる通常音声からロンバード音声への変換処理による明瞭性改善効果を調査した。その結果、十分な明瞭性改善効果が得られず、特に子音の変換処理に問題があることが分かった。
5.これらの研究成果について,国内外にて研究発表を行った。本研究成果は高い評価を受け、国内大会において計2つの賞を受賞するに至った。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

次年度の研究計画についても前倒しで実施し、研究成果を挙げることができたため。

今後の研究の推進方策

当初の計画に基づき実施するが,当初予定していた以上の成果を目指す。

次年度使用額が生じた理由

当初の計画よりも、国際会議論文発表件数が少なくなったため。

次年度使用額の使用計画

十分な研究成果が得られているが未だ対外発表を実施していない複数の研究課題に対して、迅速な対外発表を試みることで、旅費を使用する。

  • 研究成果

    (10件)

すべて 2017 2016

すべて 雑誌論文 (2件) (うち査読あり 2件、 謝辞記載あり 2件) 学会発表 (8件) (うち招待講演 2件)

  • [雑誌論文] A noise suppression method for body-conducted soft speech based on non-negative tensor factorization of air- and body-conducted signals2017

    • 著者名/発表者名
      Yusuke Tajiri, Hirokazu Kameoka, Tomoki Toda
    • 雑誌名

      Proceedings of ICASSP

      巻: - ページ: 4960-4964

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Nonaudible murmur enhancement based on statistical voice conversion and noise suppression with external noise monitoring2016

    • 著者名/発表者名
      Yusuke Tajiri, Tomoki Toda
    • 雑誌名

      Proceedings of 9th ISCA Speech Synthesis Workshop (SSW9)

      巻: - ページ: 54-60

    • 査読あり / 謝辞記載あり
  • [学会発表] 実環境下におけるサイレント音声通話の実現に向けた雑音環境変動に頑健な非可聴つぶやき強調法2017

    • 著者名/発表者名
      田尻 祐介, 亀岡 弘和, 戸田 智基
    • 学会等名
      第3回サイレント音声認識ワークショップ
    • 発表場所
      福岡朝日ビル(福岡県福岡市)
    • 年月日
      2017-10-14 – 2017-10-15
  • [学会発表] 深層学習に基づく非可聴つぶやき認識用音響モデルの構築2017

    • 著者名/発表者名
      野田 聖太, 林 知樹, 戸田 智基, 武田 一哉
    • 学会等名
      第3回サイレント音声認識ワークショップ
    • 発表場所
      福岡朝日ビル(福岡県福岡市)
    • 年月日
      2017-10-14 – 2017-10-15
  • [学会発表] 非可聴つぶやき強調のためのセグメント特徴量正則化NTF2017

    • 著者名/発表者名
      田尻 祐介, 亀岡 弘和, 戸田 智基
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      明治大学(神奈川県川崎市)
    • 年月日
      2017-03-15 – 2017-03-17
  • [学会発表] 非可聴つぶやき認識のための通常音声を活用したDNN音響モデル学習2017

    • 著者名/発表者名
      野田 聖太, 林 知樹, 戸田 智基, 武田 一哉
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      明治大学(神奈川県川崎市)
    • 年月日
      2017-03-15 – 2017-03-17
  • [学会発表] 統計的音声波形変換に基づく雑音環境下における音声了解度向上2017

    • 著者名/発表者名
      武山 知弘, 小林 和弘, 田尻 祐介, 戸田 智基, 武田 一哉
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      明治大学(神奈川県川崎市)
    • 年月日
      2017-03-15 – 2017-03-17
  • [学会発表] 音声変換技術の進展と課題2017

    • 著者名/発表者名
      戸田 智基
    • 学会等名
      日本音響学会東海支部総会・講演会
    • 発表場所
      ルブラ王山(愛知県名古屋市)
    • 年月日
      2017-03-13 – 2017-03-13
    • 招待講演
  • [学会発表] セグメント特徴量正則化NTFに基づく雑音環境下における非可聴つぶやき強調2017

    • 著者名/発表者名
      田尻 祐介, 亀岡 弘和, 戸田 智基
    • 学会等名
      電子情報通信学会/日本音響学会 音声研究会
    • 発表場所
      沖縄産業支援センター(沖縄県那覇市)
    • 年月日
      2017-03-01 – 2017-03-02
  • [学会発表] Statistical voice conversion and its application to augmented speech production2016

    • 著者名/発表者名
      Tomoki Toda
    • 学会等名
      名古屋工業大学情報科学フロンティア研究院特別講演会
    • 発表場所
      名古屋工業大学(愛知県名古屋市)
    • 年月日
      2016-11-18 – 2016-11-18
    • 招待講演

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi