• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実績報告書

教育現場における健聴者・聴覚障害者間の円滑な意思疎通を支援する音声言語基盤技術

研究課題

研究課題/領域番号 20H01716
研究機関筑波技術大学

研究代表者

小林 彰夫  筑波技術大学, 産業技術学部, 准教授 (10741168)

研究分担者 北岡 教英  豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (10333501)
西崎 博光  山梨大学, 大学院総合研究部, 准教授 (40362082)
安 啓一  筑波技術大学, 産業技術学部, 講師 (70407352)
研究期間 (年度) 2020-04-01 – 2023-03-31
キーワード聴覚障害者 / 音声認識 / 音声コーパス
研究実績の概要

本研究では,聴覚障害者の音声認識性能改善が主たる目的であることから,令和2年度(当該年度)より障害者音声データの収集およびコーパス作成を開始した. 一方で2020年初頭からのCOVID-19の流行により,緊急事態宣言が度重なって発令されることとなり,対面による学生の音声収録は予定よりも大幅に遅れることとなった(当初予定15名の収録は繰越により達成).音声の収録にあたっては,研究代表者の所属する大学内の無響室の利用が困難となったため,防音パーティションを利用した簡易的な設備を用意したうえで,可能な限りクリーンな音声が収録できるように計画を変更した.聴覚障害者の音声データの蓄積(12名)がある程度進んだ段階で,既存のend-to-endアプローチ(ESPNetによるCTCと注意機構を併用した手法)に基づく音声認識実験を行った.その結果,障害者によって認識率に大きな差が生じることがわかった.健聴者のみの音声コーパスから学習したモデルを使用した場合,音素誤り率は15.7%から71.6%(平均37.9%)となり,健聴者の誤り率(およそ誤り率10%)と遜色のない障害者がいる一方で,ほとんどの音声を認識できない障害者がいることが明らかとなった.また,収集した聴覚障害者音声を加えて聴者モデルに対する追加学習を行った場合,音素誤り率は11.0%から55.6%(平均29.7%)となり21.6%の誤りが削減された.対象となる障害者が少ないため,詳細な分析は次年度以降の研究課題とするが,聴覚障害者の音声データをより多く収集できれば,頑健な音声認識の実現が行えるとの知見を得た.

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

聴覚障害者音声の収集にあたって,当初目標は通期(2020年度)において30名を完了させる予定であったが15名にとどまった.収録者数が予定の半数に届かなかったのは,COVID-19流行における緊急事態宣言等の影響により対面での収録が進まなかったことが原因である.加えて当初予定していた研究代表者の所属する無響室の利用が困難となったため,収録計画を大幅に変更することとなった.また,教室など大体箇所での収録では残響の影響が見込まれるため,室内の反射音を抑えるために簡易的な防音パーティションを用意するなどの対策に時間を要した.

今後の研究の推進方策

本研究の成否は,多様かつ大量の聴覚障害者の音声コーパスの構築が鍵を握る.そこで,音声収集を効率的に行うため,既存のオンライン会議ソフトウェアを用いたオンライン音声収録を試みる.収録参加者(学生)および収録担当者(研究者)とをオンラインで接続し音声収録システムを構築する.収録参加者側のコンピュータにマイクロホンを接続し,ローカルコンピュータ上でPCMによる高品質な音声収録を行うとともに,オンライン環境で読み上げ文の提示と収録の指示を行い,かつ圧縮音声をも収録するシステムとして,次年度以降の効率的なデータ収集への対応を可能としたい.

  • 研究成果

    (10件)

すべて 2021 2020

すべて 雑誌論文 (4件) (うち査読あり 4件) 学会発表 (6件)

  • [雑誌論文] Development of a Low-Latency and Real-Time Automatic Speech Recognition System2020

    • 著者名/発表者名
      Leow Chee Siang、Hayakawa Tomoaki、Nishizaki Hiromitsu、Kitaoka Norihide
    • 雑誌名

      Proceedings of the 2020 IEEE 9th Global Conference on Consumer Electronics (GCCE 2020)

      巻: - ページ: 464--467

    • DOI

      10.1109/GCCE50665.2020.9291818

    • 査読あり
  • [雑誌論文] ExKaldi: A Python-based Extension Tool of Kaldi2020

    • 著者名/発表者名
      Wang Yu、Leow Chee Siang、Nishizaki Hiromitsu、Kobayashi Akio、Utsuro Takehito
    • 雑誌名

      Proceedings of the 2020 IEEE 9th Global Conference on Consumer Electronics (GCCE 2020)

      巻: - ページ: 470--473

    • DOI

      10.1109/GCCE50665.2020.9291717

    • 査読あり
  • [雑誌論文] End-to-end recognition of streaming Japanese speech using CTC and local attention2020

    • 著者名/発表者名
      Chen Jiahao、Nishimura Ryota、Kitaoka Norihide
    • 雑誌名

      APSIPA Transactions on Signal and Information Processing

      巻: 9 ページ: 1--7

    • DOI

      10.1017/ATSIP.2020.23

    • 査読あり
  • [雑誌論文] Disfluencies and Strategies Used by People Who Stutter During a Working Memory Task2020

    • 著者名/発表者名
      Arongna, Naomi Sakai, Keiichi Yasu and Koichi Mori
    • 雑誌名

      Journal of Speech, Language, and Hearing Research

      巻: 63 ページ: 688--701

    • 査読あり
  • [学会発表] 聴覚障害者の音声データの収集と音素認識による評価2021

    • 著者名/発表者名
      小林彰夫 , 安啓一 , 西崎博光 , 北岡教英
    • 学会等名
      日本音響学会研究発表会講演論文集
  • [学会発表] Uni-directional LSTM と Local Attentionを用いたストリーミング音声認識2020

    • 著者名/発表者名
      陳 家浩,西村 良太,北岡 教英
    • 学会等名
      日本音響学会講演論文集
  • [学会発表] 若年の補聴器・人工内耳装用者における語音検査と自身の発話明瞭性の関係2020

    • 著者名/発表者名
      安啓一,種子田尚人,石井悠貴
    • 学会等名
      日本音響学会秋季研究発表会講演論文集
  • [学会発表] 加齢性難聴に伴うポピュラーソングの印象変化の検討~模擬難聴を用いて2020

    • 著者名/発表者名
      寺澤 洋子,水野 真由美,山本 雄也,大中 悠生,石川 嘉秀,松井 淑恵,安啓一
    • 学会等名
      日本音響学会秋季研究発表会講演論文集
  • [学会発表] 加齢性難聴者のサイン音認知の研究にむけて2020

    • 著者名/発表者名
      大中悠生, 安啓一, 松井淑惠, 寺澤洋子
    • 学会等名
      情報処理学会研究報告
  • [学会発表] 聴覚障害者の調性認知に関する検討2020

    • 著者名/発表者名
      寺澤洋子, 相馬翔太, 安啓一, 平賀瑠美
    • 学会等名
      情報処理学会研究報告

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi