• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Annual Research Report

Construction of acoustic model on small training data for dysarthric speech recognition

Research Project

Project/Area Number 20K19862
Research InstitutionKobe University

Principal Investigator

高島 遼一  神戸大学, 都市安全研究センター, 准教授 (50846102)

Project Period (FY) 2020-04-01 – 2022-03-31
Keywords音声認識 / 構音障害 / 障害者支援技術 / 機械学習 / ニューラルネットワーク
Outline of Annual Research Achievements

本研究では、大量の学習データを得ることが難しい構音障害者を対象として、高精度な音声認識モデルの構築を目指している。少量の学習データで音声認識モデルを学習するための方法として、前年度に検討したSelf-supervised learningに基づく方法をさらに性能改善する方式を検討した。Self-supervised learningは、ラベルの無いデータを活用することで、性能の良い初期モデルを学習する方法の一つである。この手法を用いることで、ラベルの付与が困難な構音障害者の自由発話を学習データとして利用可能となる。今年度は、Self-supervised learningに加えて、音声認識結果を疑似的なラベルとして利用する疑似ラベリングの手法と組み合わせることで性能向上を行う手法を検討した。音声認識ラベルを一切使用しないSelf-supervised learningと比べて、疑似ラベリングは音声認識ラベルを使用するため、より音声認識に適した学習が行われると期待される。しかし疑似ラベリングは音声認識結果を正解ラベルの代わりにしようするため、疑似ラベルの誤りが学習に悪影響を及ぼすことが懸念される。そこで検討手法では、疑似ラベルを生成するための音声認識において計算される事後確率から、生成された疑似ラベルの信頼度を計算し、その信頼度に基づいて、疑似ラベリングによる学習とSelf-supervised learningによる学習のどちらを重視するかを重みづけしながらモデルの学習を行う方式を提案した。我々が独自に収録した脳性麻痺による構音障害者音声を用いた実験の結果、従来方式の音声認識誤り率に対して、Self-supervised learning単体を用いることで約15.2%の改善が得られ、さらに疑似ラベリングの併用により、従来方式から約22.4%の改善が得られた。

  • Research Products

    (9 results)

All 2022 2021 Other

All Presentation (8 results) (of which Int'l Joint Research: 3 results) Remarks (1 results)

  • [Presentation] Data Augmentation for Dysarthric Speech Recognition Based on Text-to-Speech Synthesis2022

    • Author(s)
      Yuki Matsuzaka, Ryoichi Takashima, Chiho Sasaki, Tetsuya Takiguchi
    • Organizer
      IEEE LifeTech
    • Int'l Joint Research
  • [Presentation] Adaptation of a Pronunciation Dictionary for Dysarthric Speech Recognition2022

    • Author(s)
      Yuya Sawa, Ryoichi Takashima, Tetsuya Takiguchi
    • Organizer
      IEEE LifeTech
    • Int'l Joint Research
  • [Presentation] 構音障害者音声認識における自己教師あり学習と疑似ラベリングの動的重み付きマルチタスク学習2022

    • Author(s)
      澤 佑哉, 相原 龍, 高島 遼一, 滝口 哲也, 今井 良枝
    • Organizer
      日本音響学会2022年春季研究発表会講演論文集
  • [Presentation] 構音障害者音声認識におけるテキスト音声合成によるデータ拡張の検討2022

    • Author(s)
      松坂 勇樹, 高島 遼一, 佐々木 千穂, 滝口 哲也
    • Organizer
      日本音響学会2022年春季研究発表会講演論文集
  • [Presentation] 異なる疾患の障害者音声を用いた器質性構音障害者音声認識モデルの学習2022

    • Author(s)
      冨士原 健斗, 高島 遼一, 杉山 千尋, 田中 信和, 野原 幹司, 野崎 一徳, 滝口 哲也
    • Organizer
      日本音響学会2022年春季研究発表会講演論文集
  • [Presentation] Data Augmentation Based on Frequency Warping for Recognition of Cleft Palate Speech2021

    • Author(s)
      Kento Fujiwara, Ryoichi Takashima, Chihiro Sugiyama, Nobukazu Tanaka, Kanji Nohara, Kazunori Nozaki, Tetsuya Takiguchi
    • Organizer
      APSIPA
    • Int'l Joint Research
  • [Presentation] 擬似ラベリングと特徴表現学習を併用した構音障害者音声認識2021

    • Author(s)
      澤 佑哉,冨士原 健斗,相原 龍,高島 遼一,滝口 哲也,今井 良枝
    • Organizer
      日本音響学会2021年秋季研究発表会講演論文集
  • [Presentation] 誤り訂正に基づく器質性構音障害者の音声認識精度向上の検討2021

    • Author(s)
      冨士原 健斗,高島 遼一,杉山 千尋,田中 信和,野原 幹司,野崎 一徳,滝口 哲也
    • Organizer
      日本音響学会2021年秋季研究発表会講演論文集
  • [Remarks] 研究者webページ

    • URL

      http://www.me.cs.scitec.kobe-u.ac.jp/~rtakashima/

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi