• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2023 年度 実施状況報告書

日常生活音を活用した構音障害者のための音響監視および音声認識システムの研究

研究課題

研究課題/領域番号 22K12168
研究機関神戸大学

研究代表者

高島 遼一  神戸大学, 都市安全研究センター, 准教授 (50846102)

研究期間 (年度) 2022-04-01 – 2025-03-31
キーワード音声認識 / 音響イベント分類 / 構音障害 / 障害者支援技術 / 機械学習 / ニューラルネットワーク
研究実績の概要

構音障害者音声認識においては、昨年度に検討した自己教師あり学習による日常会話音声の音声認識モデル学習への活用手法について、さらなる改良を検討した。昨年度に検討したwav2vec2.0による自己教師あり学習法は、教師ラベル(発話内容ラベル)が存在しない日常会話音を学習データとして利用可能にした。しかしこの手法は教師ラベルを使用しないため、音声認識モデルの学習において間接的にしか日常会話音を利用できていなかった。今年度は、自己教師あり学習に加え、音声認識によって得られた認識結果を擬似的な教師ラベルとして用いる手法を検討した。その結果、脳性麻痺者音声認識の実験において昨年度よりも高い音声認識性能を得られた。
音声認識に関しては今年度の新たな試みとして、吃音者音声認識の検討を開始した。吃音は構音障害ではないが、発話時に連発や難発といった症状が出るため、健常者と比べて音声認識率が低下する課題がある。本研究では、吃音者音声の学習データ中に連発が発生した箇所に連発ラベルを付与し、その学習データを用いることで、連発検出と音声認識を同時に行うモデルを開発した。音声認識実験を行い、検出した連発箇所を音声認識させないようにすることで、音声認識率を向上させることが示された。
音響イベント分類においては、昨年度に検討したゼロショット音響イベント分類手法について、さらなる改良を検討した。昨年度に検討した音の属性情報に基づくゼロショット学習手法は、定義した属性(例えば「打撃音」や「金属音」)の種類不足により、原理的に分類が不可能なイベントクラスが多数存在していた。今年度は、打撃音に対する「コン」や「トン」といった音の言語表現であるオノマトペを属性情報に加えることで、より詳細な分類を行う手法を検討した。実験の結果、昨年度の手法に加えてさらに高い性能でゼロショット分類が可能であることが示された。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

音声認識の研究においては、昨年度に検討した日常会話音声の音声認識モデルへの活用方法を改良し、さらに性能改善することができた。またこの研究と並行して、新たに吃音者音声認識の検討を開始し、従来の音声認識手法と比べて高い性能の認識モデルを構築することができた。音響イベント分類の研究においても、昨年度に検討した属性情報に基づくゼロショット学習手法に対して、当初の予定通り属性情報の拡張によって性能改善をすることができた。これらの成果はジャーナル論文であるIEEE Access、国際会議であるICASSP2023、国内会議である日本音響学会2023年研究発表会などで発表した。

今後の研究の推進方策

構音障害者音声認識においては、引き続きwav2vec2.0ベースの自己教師あり学習手法をさらに改良することで性能改善を検討する。また吃音者音声認識についても今年度は検討に含めなかった難発や伸発の問題についても検討していく。音響イベント分類においては、生成ベースのゼロショット学習手法などを用いることで、性能改善を検討する。また、これまで開発した認識システムを用いて、構音障害者を対象とした実証実験も行っていく。

  • 研究成果

    (5件)

すべて 2024 2023 その他

すべて 雑誌論文 (1件) 学会発表 (3件) (うち国際学会 1件) 備考 (1件)

  • [雑誌論文] Dysarthric Speech Recognition Using Pseudo-Labeling, Self-Supervised Feature Learning, and a Joint Multi-Task Learning Approach2024

    • 著者名/発表者名
      Takashima Ryoichi, Sawa Yuya, Aihara Ryo, Takiguchi Tetsuya, Imai Yoshie
    • 雑誌名

      IEEE Access

      巻: 12 ページ: 36990~36999

    • DOI

      10.1109/ACCESS.2024.3374874

  • [学会発表] wav2vec 2.0と疑似ラベリングを活用した脳性麻痺者の音声認識2024

    • 著者名/発表者名
      松坂 勇樹, 高島 遼一, 滝口 哲也
    • 学会等名
      日本音響学会2024年春季研究発表会講演論文集
  • [学会発表] Zero-Shot Sound Event Classification Using a Sound Attribute Vector with Global and Local Feature Learning2023

    • 著者名/発表者名
      Yihan Lin, Xunquan Chen, Ryoichi Takashima, Tetsuya Takiguchi
    • 学会等名
      2023 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
    • 国際学会
  • [学会発表] 吃音者の音声認識における連発ラベル導入による連発箇所の検出2023

    • 著者名/発表者名
      松坂 勇樹, 高島 遼一, 安井 美鈴, 滝口 哲也
    • 学会等名
      日本音響学会2023年秋季研究発表会講演論文集
  • [備考] 研究者webページ

    • URL

      http://www.me.cs.scitec.kobe-u.ac.jp/~rtakashima/

URL: 

公開日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi