• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

日常生活音を活用した構音障害者のための音響監視および音声認識システムの研究

研究課題

研究課題/領域番号 22K12168
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分61030:知能情報学関連
研究機関神戸大学

研究代表者

高島 遼一  神戸大学, 都市安全研究センター, 准教授 (50846102)

研究期間 (年度) 2022-04-01 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2024年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2022年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
キーワード音声認識 / 音響イベント分類 / 構音障害 / 障害者支援技術 / 機械学習 / ニューラルネットワーク / 音響監視
研究開始時の研究の概要

本研究では、構音障害者のコミュニケーション支援のための障害者音声認識技術、および安全監視のための音響イベント検出技術の開発を目的とする。この目的において、音声認識および異常イベントの学習データの収集が困難であることが課題である。そこで本研究では「自己教師有り学習と日常会話収録音声を用いた障害者音声認識モデル学習」と「学習データに存在しない音響イベントを検出するゼロショット学習」をコア技術とし、常時収録による障害者の安全監視・音声認識・学習データ自動収集を同時に行うシステムを検討する。実用レベルの構音障害者音声認識の実現、および未知の異常データを検知する実現可能性検証を目標とする。

研究実績の概要

構音障害者音声認識においては、昨年度に検討した自己教師あり学習による日常会話音声の音声認識モデル学習への活用手法について、さらなる改良を検討した。昨年度に検討したwav2vec2.0による自己教師あり学習法は、教師ラベル(発話内容ラベル)が存在しない日常会話音を学習データとして利用可能にした。しかしこの手法は教師ラベルを使用しないため、音声認識モデルの学習において間接的にしか日常会話音を利用できていなかった。今年度は、自己教師あり学習に加え、音声認識によって得られた認識結果を擬似的な教師ラベルとして用いる手法を検討した。その結果、脳性麻痺者音声認識の実験において昨年度よりも高い音声認識性能を得られた。
音声認識に関しては今年度の新たな試みとして、吃音者音声認識の検討を開始した。吃音は構音障害ではないが、発話時に連発や難発といった症状が出るため、健常者と比べて音声認識率が低下する課題がある。本研究では、吃音者音声の学習データ中に連発が発生した箇所に連発ラベルを付与し、その学習データを用いることで、連発検出と音声認識を同時に行うモデルを開発した。音声認識実験を行い、検出した連発箇所を音声認識させないようにすることで、音声認識率を向上させることが示された。
音響イベント分類においては、昨年度に検討したゼロショット音響イベント分類手法について、さらなる改良を検討した。昨年度に検討した音の属性情報に基づくゼロショット学習手法は、定義した属性(例えば「打撃音」や「金属音」)の種類不足により、原理的に分類が不可能なイベントクラスが多数存在していた。今年度は、打撃音に対する「コン」や「トン」といった音の言語表現であるオノマトペを属性情報に加えることで、より詳細な分類を行う手法を検討した。実験の結果、昨年度の手法に加えてさらに高い性能でゼロショット分類が可能であることが示された。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

音声認識の研究においては、昨年度に検討した日常会話音声の音声認識モデルへの活用方法を改良し、さらに性能改善することができた。またこの研究と並行して、新たに吃音者音声認識の検討を開始し、従来の音声認識手法と比べて高い性能の認識モデルを構築することができた。音響イベント分類の研究においても、昨年度に検討した属性情報に基づくゼロショット学習手法に対して、当初の予定通り属性情報の拡張によって性能改善をすることができた。これらの成果はジャーナル論文であるIEEE Access、国際会議であるICASSP2023、国内会議である日本音響学会2023年研究発表会などで発表した。

今後の研究の推進方策

構音障害者音声認識においては、引き続きwav2vec2.0ベースの自己教師あり学習手法をさらに改良することで性能改善を検討する。また吃音者音声認識についても今年度は検討に含めなかった難発や伸発の問題についても検討していく。音響イベント分類においては、生成ベースのゼロショット学習手法などを用いることで、性能改善を検討する。また、これまで開発した認識システムを用いて、構音障害者を対象とした実証実験も行っていく。

報告書

(2件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 研究成果

    (12件)

すべて 2024 2023 2022 その他

すべて 雑誌論文 (1件) 学会発表 (10件) (うち国際学会 2件) 備考 (1件)

  • [雑誌論文] Dysarthric Speech Recognition Using Pseudo-Labeling, Self-Supervised Feature Learning, and a Joint Multi-Task Learning Approach2024

    • 著者名/発表者名
      Takashima Ryoichi, Sawa Yuya, Aihara Ryo, Takiguchi Tetsuya, Imai Yoshie
    • 雑誌名

      IEEE Access

      巻: 12 ページ: 36990-36999

    • DOI

      10.1109/access.2024.3374874

    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] wav2vec 2.0と疑似ラベリングを活用した脳性麻痺者の音声認識2024

    • 著者名/発表者名
      松坂 勇樹, 高島 遼一, 滝口 哲也
    • 学会等名
      日本音響学会2024年春季研究発表会講演論文集
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] Zero-Shot Sound Event Classification Using a Sound Attribute Vector with Global and Local Feature Learning2023

    • 著者名/発表者名
      Yihan Lin, Xunquan Chen, Ryoichi Takashima, Tetsuya Takiguchi
    • 学会等名
      2023 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] 吃音者の音声認識における連発ラベル導入による連発箇所の検出2023

    • 著者名/発表者名
      松坂 勇樹, 高島 遼一, 安井 美鈴, 滝口 哲也
    • 学会等名
      日本音響学会2023年秋季研究発表会講演論文集
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 音響イベントのゼロショット学習における属性情報の拡張2023

    • 著者名/発表者名
      Lin Yi-Han, 高島 遼一, 滝口 哲也
    • 学会等名
      日本音響学会2023年春季研究発表会講演論文集
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] wav2vec 2.0によるラベル無し複数患者音声を用いた脳性麻痺患者の音声認識2023

    • 著者名/発表者名
      日本音響学会2023年春季研究発表会講演論文集
    • 学会等名
      日本音響学会2023年春季研究発表会講演論文集
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 器質性構音障害者音声認識のための簡易ラベルによる中間層ロスの導入2023

    • 著者名/発表者名
      冨士原 健斗, 高島 遼一, 杉山 千尋, 田中 信和, 野原 幹司, 野崎 一徳, 滝口 哲也
    • 学会等名
      日本音響学会2023年春季研究発表会講演論文集
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] Binary Attribute Embeddings for Zero-Shot Sound Event Classification2022

    • 著者名/発表者名
      Yihan Lin, Xunquan Chen, Ryoichi Takashima, Tetsuya Takiguchi
    • 学会等名
      IEEE GCCE
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会
  • [学会発表] Attribute Prototype Networkを用いた音響イベントのゼロショット学習2022

    • 著者名/発表者名
      LIN YIHAN, 高島遼一, 滝口哲也
    • 学会等名
      日本音響学会2022年秋季研究発表会講演論文集
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 器質性構音障害者向け音声認識モデルにおける発話辞書適応方式の比較検討2022

    • 著者名/発表者名
      冨士原健斗, 高島遼一, 杉山千尋, 田中信和, 野原幹司, 野崎一徳, 滝口哲也
    • 学会等名
      日本音響学会2022年秋季研究発表会講演論文集
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] wav2vec 2.0 によるラベル無し音声を用いた脳性麻痺患者の音声認識2022

    • 著者名/発表者名
      松坂勇樹, 高島遼一, 滝口哲也
    • 学会等名
      日本音響学会2022年秋季研究発表会講演論文集
    • 関連する報告書
      2022 実施状況報告書
  • [備考] 研究者webページ

    • URL

      http://www.me.cs.scitec.kobe-u.ac.jp/~rtakashima/

    • 関連する報告書
      2023 実施状況報告書 2022 実施状況報告書

URL: 

公開日: 2022-04-19   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi