• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

構音障害者のための少量学習データでの音声認識モデル構築

研究課題

研究課題/領域番号 20K19862
研究種目

若手研究

配分区分基金
審査区分 小区分61030:知能情報学関連
研究機関神戸大学

研究代表者

高島 遼一  神戸大学, 都市安全研究センター, 准教授 (50846102)

研究期間 (年度) 2020-04-01 – 2022-03-31
研究課題ステータス 完了 (2021年度)
配分額 *注記
3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
2021年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2020年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
キーワード音声認識 / 構音障害 / 障害者支援技術 / 機械学習 / ニューラルネットワーク
研究開始時の研究の概要

本研究では、構音障害者のコミュニケーション支援を目的とした、構音障害者音声認識システムの開発を行う。構音障害者の音声は健常者の音声と特徴が大きく異なるため、個々の障害者音声に合わせたモデルの構築が必要である。しかし、モデル学習に十分な量の構音障害者音声の収集は困難なため、少量データでのモデル構築が必須である。本研究では、様々な言語、様々な構音障害症状のデータから、共通な構音障害特徴を抽出することで、個々の障害話者から得られるデータが少量でも、個々のデータ不足を補完してモデルの学習を行う手法を検討する。また実証実験を通じて、実用に耐え得るレベルの構音障害者音声認識システムの実現を目指す。

研究成果の概要

本研究は構音障害者のコミュニケーション支援のための音声認識システムの構築を目的とする。音声認識モデルの学習において、学習に十分な量の構音障害者音声の収集が困難な点が課題である。そこで本研究では、大量の健常者音声を学習に利用するための転移学習と、比較的収集が容易な障害者の自由発話音声を利用するための自己教師有り学習を用いたモデル学習手法を検討した。前者では健常者モデルから対象の障害者モデルへ段階的に近づける多段階転移学習を提案し、また後者では疑似ラベルと自己教師有り学習を組み合わせた手法などを提案し、いずれも従来法より高い性能を確認した。

研究成果の学術的意義や社会的意義

本研究は構音障害者の社会的バリアを除去し、社会参加を支援することへの貢献が期待されるものである。運動障害に起因する構音障害者は手足も不自由なために手話などのコミュニケーションの代替手段が取れないケースも多いため、高精度な音声認識の実現が求められている。また本研究で特に焦点を当てている、学習データ不足の問題は構音障害者に限らず音声認識全般にわたって存在する課題であるため、本研究で提案した多段階転移および疑似ラベルと自己教師有り学習に基づく音声認識モデルの学習手法は、音声認識の広い分野において応用可能であると期待している。

報告書

(3件)
  • 2021 実績報告書   研究成果報告書 ( PDF )
  • 2020 実施状況報告書
  • 研究成果

    (16件)

すべて 2022 2021 2020 その他

すべて 学会発表 (15件) (うち国際学会 6件) 備考 (1件)

  • [学会発表] Data Augmentation for Dysarthric Speech Recognition Based on Text-to-Speech Synthesis2022

    • 著者名/発表者名
      Yuki Matsuzaka, Ryoichi Takashima, Chiho Sasaki, Tetsuya Takiguchi
    • 学会等名
      IEEE LifeTech
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] Adaptation of a Pronunciation Dictionary for Dysarthric Speech Recognition2022

    • 著者名/発表者名
      Yuya Sawa, Ryoichi Takashima, Tetsuya Takiguchi
    • 学会等名
      IEEE LifeTech
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] 構音障害者音声認識における自己教師あり学習と疑似ラベリングの動的重み付きマルチタスク学習2022

    • 著者名/発表者名
      澤 佑哉, 相原 龍, 高島 遼一, 滝口 哲也, 今井 良枝
    • 学会等名
      日本音響学会2022年春季研究発表会講演論文集
    • 関連する報告書
      2021 実績報告書
  • [学会発表] 構音障害者音声認識におけるテキスト音声合成によるデータ拡張の検討2022

    • 著者名/発表者名
      松坂 勇樹, 高島 遼一, 佐々木 千穂, 滝口 哲也
    • 学会等名
      日本音響学会2022年春季研究発表会講演論文集
    • 関連する報告書
      2021 実績報告書
  • [学会発表] 異なる疾患の障害者音声を用いた器質性構音障害者音声認識モデルの学習2022

    • 著者名/発表者名
      冨士原 健斗, 高島 遼一, 杉山 千尋, 田中 信和, 野原 幹司, 野崎 一徳, 滝口 哲也
    • 学会等名
      日本音響学会2022年春季研究発表会講演論文集
    • 関連する報告書
      2021 実績報告書
  • [学会発表] Data Augmentation Based on Frequency Warping for Recognition of Cleft Palate Speech2021

    • 著者名/発表者名
      Kento Fujiwara, Ryoichi Takashima, Chihiro Sugiyama, Nobukazu Tanaka, Kanji Nohara, Kazunori Nozaki, Tetsuya Takiguchi
    • 学会等名
      APSIPA
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] 擬似ラベリングと特徴表現学習を併用した構音障害者音声認識2021

    • 著者名/発表者名
      澤 佑哉,冨士原 健斗,相原 龍,高島 遼一,滝口 哲也,今井 良枝
    • 学会等名
      日本音響学会2021年秋季研究発表会講演論文集
    • 関連する報告書
      2021 実績報告書
  • [学会発表] 誤り訂正に基づく器質性構音障害者の音声認識精度向上の検討2021

    • 著者名/発表者名
      冨士原 健斗,高島 遼一,杉山 千尋,田中 信和,野原 幹司,野崎 一徳,滝口 哲也
    • 学会等名
      日本音響学会2021年秋季研究発表会講演論文集
    • 関連する報告書
      2021 実績報告書
  • [学会発表] 口唇口蓋裂者の音声認識のためのデータ拡張方式の検討2021

    • 著者名/発表者名
      冨士原 健斗,高島 遼一,杉山 千尋,田中 信和,野原 幹司,野崎 一徳,滝口 哲也
    • 学会等名
      日本音響学会2021年春季研究発表会講演論文集
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] 自己教師あり学習によるラベル無し自由発話を用いた構音障害者音声認識2021

    • 著者名/発表者名
      澤 佑哉,冨士原 健斗,相原 龍,高島 遼一,滝口 哲也,本山 信明
    • 学会等名
      日本音響学会2021年春季研究発表会講演論文集
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] Dysarthric Speech Recognition Based on Deep Metric Learning2020

    • 著者名/発表者名
      Yuki Takashima, Ryoichi Takashima, Tetsuya Takiguchi, Yasuo Ariki
    • 学会等名
      Interspeech
    • 関連する報告書
      2020 実施状況報告書
    • 国際学会
  • [学会発表] An Investigation of End-to-End Speech Recognition Using Model Adaptation for Dysarthric Speakers2020

    • 著者名/発表者名
      Yuya Sawa, Ryoichi Takashima, Tetsuya Takiguchi
    • 学会等名
      IEEE Global Conference on Consumer Electronics (GCCE)
    • 関連する報告書
      2020 実施状況報告書
    • 国際学会
  • [学会発表] Two-Step Acoustic Model Adaptation for Dysarthric Speech Recognition2020

    • 著者名/発表者名
      Ryoichi Takashima, Tetsuya Takiguchi, Yasuo Ariki
    • 学会等名
      ICASSP
    • 関連する報告書
      2020 実施状況報告書
    • 国際学会
  • [学会発表] 構音障害者音声認識における発話辞書適応の検討2020

    • 著者名/発表者名
      澤 佑哉, 高島 遼一, 滝口 哲也, 有木 康雄
    • 学会等名
      日本音響学会2020年秋季研究発表会講演論文集
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] 構音障害者音声認識における認識モデルの比較評価2020

    • 著者名/発表者名
      高島 遼一, 有木 康雄, 滝口 哲也
    • 学会等名
      日本音響学会2020年秋季研究発表会講演論文集
    • 関連する報告書
      2020 実施状況報告書
  • [備考] 研究者webページ

    • URL

      http://www.me.cs.scitec.kobe-u.ac.jp/~rtakashima/

    • 関連する報告書
      2021 実績報告書 2020 実施状況報告書

URL: 

公開日: 2020-04-28   更新日: 2023-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi