• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

Development of silent speech telecommunication techniques robust against external noise

Research Project

Project/Area Number 15K12064
Research InstitutionNagoya University

Principal Investigator

戸田 智基  名古屋大学, 情報基盤センター, 教授 (90403328)

Co-Investigator(Kenkyū-buntansha) 中村 哲  奈良先端科学技術大学院大学, データ駆動型サイエンス創造センター, 教授 (30263429) [Withdrawn]
サクリアニ サクティ  奈良先端科学技術大学院大学, 先端科学技術研究科, 特任准教授 (00395005) [Withdrawn]
Neubig Graham  奈良先端科学技術大学院大学, 先端科学技術研究科, 客員准教授 (70633428) [Withdrawn]
Project Period (FY) 2015-04-01 – 2019-03-31
Keywords音声等認識
Outline of Annual Research Achievements

周囲に聴取困難なほど微弱なささやき声によるサイレント音声コミュニケーションの実環境下への適用を目指し、外部雑音に対して頑健に動作するサイレント音声通話技術の研究開発に取り組んだ。
1.空気・体内伝導マイクロフォンを併用した雑音抑圧技術の構築:前年度までに構築した外部雑音モニタリングを用いた雑音抑圧技術の枠組みをさらに発展させて、空気伝導マイクロフォンアレーおよび体内伝導マイクロフォンを活用して雑音抑圧を行う枠組みを考案するとともに、空気・体内伝導音信号を対象とした多チャンネル信号処理に基づく音声強調技術を構築した。実験的評価により、空気伝導音信号と体内伝導音信号を相補的に活用することで、高い雑音抑圧性能が得られることを示した。
2.ウェアラブル型空気・体内伝導マイクロフォンに基づく空気・体内伝導音収録システムの構築:ネックバンド式の体内伝導マイクロフォンを改良することで、空気伝導マイクロフォンアレー機能を備えたウェアラブル型空気・体内伝導音収録システムを開発した。収録された空気・体内伝導音信号に対して、上述の雑音抑圧技術を適用することで、高精度な音声強調処理が可能であることを実験的に示した。
3.耐雑音性に優れた統計的音声強調技術の構築:雑音環境下におけるサイレント音声強調性能の改善を目指し、基盤技術となる統計的音声強調処理の外部雑音に対する頑健性に関する調査を行った。実験的評価結果から、音声波形加工に基づく統計的音声強調処理が高い耐雑音性を持つことを明らかにした。
4.複数モダリティ情報を用いた音声強調技術の構築:雑音環境下におけるサイレント音声強調性能のさらなる改善を目指し、音声以外のモダリティ情報を用いた音声強調技術の構築にも取り組んだ。特に、口唇画像を併用した統計的音声強調基盤技術の構築や、呼気情報を活用した励振源生成技術の構築に取り組んだ。

  • Research Products

    (10 results)

All 2019 2018

All Presentation (10 results) (of which Int'l Joint Research: 3 results,  Invited: 1 results)

  • [Presentation] 波形加工に基づく統計的声質変換の外部雑音に対する頑健性2019

    • Author(s)
      栗田 優佑, 小林 和弘, 武田 一哉, 戸田 智基
    • Organizer
      電子情報通信学会音声研究会
  • [Presentation] 雑音環境下における統計的声質変換の頑健性に関する調査2019

    • Author(s)
      栗田 優佑, 小林 和弘, 武田 一哉, 戸田 智基
    • Organizer
      日本音響学会2019年春季研究発表会
  • [Presentation] Self-produced speech enhancement and suppression method using air- and body-conductive microphones2018

    • Author(s)
      Moe Takada, Shogo Seki, Tomoki Toda
    • Organizer
      Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2018 (APSIPA ASC 2018)
    • Int'l Joint Research
  • [Presentation] Audio-visual voice conversion using deep canonical correlation analysis for deep bottleneck features2018

    • Author(s)
      Satoshi Tamura, Kento Horio, Hajime Endo, Satoru Hayamizu, Tomoki Toda
    • Organizer
      INTERSPEECH 2018
    • Int'l Joint Research
  • [Presentation] Designing a pneumatic bionic voice prosthesis - statistical approach for source excitation generation2018

    • Author(s)
      Farzaneh Ahmadi, Tomoki Toda
    • Organizer
      INTERSPEECH 2018
    • Int'l Joint Research
  • [Presentation] 音声変換による発声機能の拡張2018

    • Author(s)
      戸田 智基
    • Organizer
      東京大学ヒューマンオーグメンテーション学第4回セミナー
    • Invited
  • [Presentation] ウェアラブルな空気/体内伝導マイクロフォンを用いた自己発声音強調/抑圧法2018

    • Author(s)
      高田 萌絵, 関 翔悟, 戸田 智基
    • Organizer
      電子情報通信学会電気音響研究会
  • [Presentation] 空気/体内伝導マイクロフォンを用いた雑音環境下における自己発声音強調/抑圧法2018

    • Author(s)
      高田 萌絵, 関 翔悟, 戸田 智基
    • Organizer
      日本音響学会2018年秋季研究発表会
  • [Presentation] 深層ボトルネック特徴と深層正準相関分析を用いたマルチモーダル声質変換2018

    • Author(s)
      田村 哲嗣, 堀尾 健斗, 遠藤 肇, 速水 悟, 戸田 智基
    • Organizer
      電子情報通信学会音声研究会
  • [Presentation] 深層ボトルネック特徴と深層正準相関分析を用いたマルチモーダル声質変換2018

    • Author(s)
      田村 哲嗣, 堀尾 健斗, 遠藤 肇, 速水 悟, 戸田 智基
    • Organizer
      サイレント音声認識ワークショップ

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi