オンライン環境における健聴者・聴覚障害者間の意思疎通を支援する音声言語基盤技術

研究課題

研究課題/領域番号	23K25692
補助金の研究課題番号	23H00995 (2023)
研究種目	基盤研究(B)
配分区分	基金 (2024) 補助金 (2023)
応募区分	一般
審査区分	小区分09070:教育工学関連
研究機関	大和大学
研究代表者	小林彰夫大和大学, 情報学部, 教授 (10741168)
研究分担者	北岡教英豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (10333501) 西崎博光山梨大学, 大学院総合研究部, 教授 (40362082) 安啓一筑波技術大学, 産業技術学部, 准教授 (70407352)
研究期間 (年度)	2023-04-01 – 2026-03-31
研究課題ステータス	交付 (2024年度)
配分額 *注記	11,310千円 (直接経費: 8,700千円、間接経費: 2,610千円) 2025年度: 3,510千円 (直接経費: 2,700千円、間接経費: 810千円) 2024年度: 2,860千円 (直接経費: 2,200千円、間接経費: 660千円) 2023年度: 4,940千円 (直接経費: 3,800千円、間接経費: 1,140千円)
キーワード	聴覚障害者 / 音声認識 / 声質変換 / 音声コミュニケーション / オンラインコミュニケーション / ろう・難聴 / 情報保障
研究開始時の研究の概要	新型コロナ感染症の流行では、大学で多くの講義等でオンラインコミュニケーションが著しく増加した。聴覚障害者と健聴者とのオンラインコミュニケーションに着目すると、筆談 (チャット)は煩雑で時間がかかる。また、通信品質の低い音声は健聴者・障害者ともに聞き取りが困難である。そこで本研究課題では、健聴者と障害者双方に視覚情報(字幕)および聴覚情報(音声)の両者を併用して提示することにより頑健なオンラインコミュニケーションを実現する、音声言語処理技術に基づく拡張型音声コミュニケーションアシスタントを研究する。
研究実績の概要	本研究では、聴覚障害者と健聴者の円滑なオンラインコミュニーケーションの実現を目的としている。本年度は、音声認識およびコミュニーションの分析に共する収集済みの聴覚障害者の音声データに対するアノテーション付与を行った。これらの多くは、既存のオンライン会議システムを用いて映像・音声を収録したものである。聴覚障害者の音声認識では調音音声学や音韻論に基づく音韻的な特徴を併用する手法を導入することにより認識性能の改善を図った。また聴覚障害者の聴取に関して、聴者と聴覚障害者で構成されるグループでの雑音環境下の音声コミュニケーションにおける聞き取りやすさの改善について検討を行った。本年度は、既存の手法であるSpeakerBeam（目的話者と妨害話者の混合音に対するマスクを生成して目的話者音声のみを抽出する手法）を採用した。聴覚障害者を対象とした主観評価および客観評価（HASPIおよびHASQI）いずれの評価においても抽出した音声が元の混合音に比べて聞き取りやすくなったことがわかった。特に、主観評価では、目的話者の音声に対する妨害話者音声のSN比が小さい（目的話者音声が聞き取りにくくなる）場合に、目的音抽出の効果が最もよく現れた。一方、SN比が大きくなる（目的話者音声が聞き取りやすくなる）につれて効果が低くなっており、また目的音を抽出した音声のほうがもとの音声（目的話者と妨害話者の混合音）よりも主観評価のばらつきが小さく、聴力が異なる障害者間でも聞き取りやすさの評価が安定していることがわかった。
現在までの達成度 (区分)	現在までの達成度 (区分) 4: 遅れている理由発話聴取およびオンラインコミュニケーション実験で予定していた研究協力者の協力に関して、実験協力者のプライバシー保護の事由により学内倫理審査に諮ったが、承認が大幅に遅延したことにともない、実験開始時期の変更を行ったため。
今後の研究の推進方策	聴覚障害者の音声データの収集が不十分であることから、障害学生などを対象にオンライン対話の収集を進めていく。また、音声を聴取した際の発話明瞭度に関して、健聴者の主観評価を行う。これは、声質変換等の技術により聴覚障害者の不明瞭な発話の明瞭度を改善する際の基準が必要となるためである。声質変換については、健聴者や聴覚障害者が主観評価した際にもっとも明瞭かつ個人性を損なわない手法の研究開発に着手する。音声認識は健聴者と聴覚障害者のコミュニケーションにおける補助的な支援方法（本研究では音声コミュニケーションが主体であるため）にあたるが、音声データの蓄積にあわせて性能改善を図っていく。

報告書

(1件)

2023 実績報告書

研究成果
(5件)

すべて 2024 2023

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (4件)

[雑誌論文] Corpus Construction for Deaf Speakers and Analysis by Automatic Speech Recognition2023
- 著者名/発表者名
  Kobayashi Akio、Yasu Keiichi
- 雑誌名
  
  2023 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)
  
  巻: 1 ページ: 1-6
- DOI
  10.1109/apsipaasc58517.2023.10317192
- 関連する報告書
  2023 実績報告書
- 査読あり
[学会発表] ラジオ音声を対象とした音声強調における擬似学習データ利用の検討2024
- 著者名/発表者名
  小林彰夫、安啓一
- 学会等名
  第86回情報処理学会全国大会
- 関連する報告書
  2023 実績報告書
[学会発表] 混合音声から抽出した難聴者の発話の聞き取りやすさに関する客観的および主観的な評価による検討2024
- 著者名/発表者名
  藤江匠汰、安啓一、小林彰夫
- 学会等名
  情報処理学会アクセシビリティ研究会
- 関連する報告書
  2023 実績報告書
[学会発表] 話者適応による聴覚障害者音声認識の評価2024
- 著者名/発表者名
  高橋快斗、木内貴浩、若林佑幸、太田健吾、小林彰夫、北岡教英
- 学会等名
  情報処理学会第151回音声言語情報処理研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] 聴覚障害者音声における自己教師あり学習に基づく音声認識の評価2024
- 著者名/発表者名
  高橋快斗、木内貴浩、若林佑幸、太田健吾、小林彰夫、北岡教英
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2023 実績報告書

オンライン環境における健聴者・聴覚障害者間の意思疎通を支援する音声言語基盤技術

研究代表者

小林 彰夫 大和大学, 情報学部, 教授 (10741168)

11,310千円 (直接経費: 8,700千円、間接経費: 2,610千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] Corpus Construction for Deaf Speakers and Analysis by Automatic Speech Recognition2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] ラジオ音声を対象とした音声強調における擬似学習データ利用の検討2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] 混合音声から抽出した難聴者の発話の聞き取りやすさ に関する客観的および主観的な評価による検討2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] 話者適応による聴覚障害者音声認識の評価2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] 聴覚障害者音声における自己教師あり学習に基づく音声認識の評価2024

著者名/発表者名

学会等名

関連する報告書

小林彰夫大和大学, 情報学部, 教授 (10741168)

[学会発表] 混合音声から抽出した難聴者の発話の聞き取りやすさに関する客観的および主観的な評価による検討2024