研究課題/領域番号 |
20H01716
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分09070:教育工学関連
|
研究機関 | 大和大学 (2022) 筑波技術大学 (2020-2021) |
研究代表者 |
小林 彰夫 大和大学, 情報学部, 教授 (10741168)
|
研究分担者 |
北岡 教英 豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (10333501)
西崎 博光 山梨大学, 大学院総合研究部, 教授 (40362082)
安 啓一 筑波技術大学, 産業技術学部, 准教授 (70407352)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
18,070千円 (直接経費: 13,900千円、間接経費: 4,170千円)
2022年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2021年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2020年度: 9,750千円 (直接経費: 7,500千円、間接経費: 2,250千円)
|
キーワード | 聴覚障害者 / ろう・難聴 / 音声認識 / 情報保障 / 音声コミュニケーション / 聴覚障害 / ニューラルネットワーク / データ拡大法 / 音声言語処理 / 点訳 / 視覚障害者 / 盲ろう / 敵対的生成ネットワーク / 音声コーパス |
研究開始時の研究の概要 |
健聴者(聞こえる人)と聴覚障害者とのコミュニケーションでは、筆談や手話通訳が使われるが、いずれも円滑な意思疎通が行えていない。そこで、健聴者と障害者双方にとって円滑な意思疎通を実現する、音声言語基盤技術(コミュニケーションブリッジ)を研究する。本研究では次の5つの研究項目を実施する。1)聴覚障害者音声の収集、2)健聴者と聴覚障害者の意思疎通に有効な音響特徴、3)聴覚障害者音声の音響的特性を反映した音声認識、4)これらを統合したコミュニケーションブリッジの構築と、5)その評価。本研究により、健聴者と聴覚障害者の相互理解が深まり、ひいては障害者の社会進出が支援可能となる。
|
研究実績の概要 |
本研究における第一の目的は,聴覚障害者の音声認識性能改善であるが,障害者の発話はコーパスとして整備されてこなかった経緯もあり,音声認識のための学習データが大幅に不足している.そこで,前年度に引き続き障害者からの音声データの収集およびコーパス作成を継続的に行った.研究計画の遂行にあたり,対面による聴覚障害者の音声収録はCOVID-19の流行が原因となって予定よりも遅れることとなり,最終年度では合計50名となった.収録内容はATR音素バランス文503文を中心として,話者一人当たりおおむね600から700文章を収集した. また,発話明瞭度の著しく低い一部を除く障害者に対して,面談形式による自由発話の収録を行った.前年度の実績を踏まえ,オンラインビデオ会議ソフトウェアを併用したリモート音声収録システムを構築した.これは,圧縮音声およびPCM音声の両者を収録するシステムであり,本年度末までに合計12.5時間の教員との対面/オンラインによる音声コミュニケーションを収録し,アノテーションを追加してコーパスを作成した.一方,聴覚障害者の音声認識では,調音音声学や音韻論に基づく音韻的な特徴を併用する手法を導入することにより,認識性能の改善を図った.音韻特徴に基づく損失関数の導入により,従来の音素に基づく損失関数に対して性能の低下を相補的に補完することがわかり,聴覚障害者を対象とした音素誤り率の評価では,対象とした障害者すべてに対して認識性能の改善がみられた.
|
現在までの達成度 (段落) |
令和4年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和4年度が最終年度であるため、記入しない。
|