研究概要 |
今年度は,音声認識を利用して文字生成を行う担当者である復唱担当者に注目し,この復唱担当者の能力を補う手法に関する研究を主に実施した.まず復唱担当者の作業の困難性について述べる.復唱担当者が,遠隔地にいる講師の音声情報,または同じ講義室内にいる講師の肉声を聴取し,間を空けずに「復唱」し,その音声を音声認識用PCヘマイクロホン等を介して入力する.その過程で問題となるのが,復唱することにとって生ずる自分自身の音声と講師の音声との音響的な混合である.混合された音声を聴取しながら「復唱」作業を実施する.担当者にようて個人差はあるが,この音声の混合によって聴取したい音声の聞き取りが困難になる. この低下する聴取能力を,工学的な技術によって軽減することを目的に,「スピーカを用いた音声聴取による復唱能力」と「ヘッドホンを用いた音声聴取による復唱能力」の詳細な比較実験を行った。このヘッドホン利用は,自分自身の音声の聴取割合を抑圧し,各音声の混合比率を変化させ,復唱精度の向上が期待できると我々は推察した.その結果,被験者の個人差はあったが,すべての被験者で改善がみられた.講師音声の発話速度が速くなると,ヘッドホン利用時およびスピーカ利用時でともに,精度は悪化してゆくが,それでも,ヘッドホンを使用することによって発話速度100[mora/sec]程度の優位性があった(スピーカから講師音声をゆっくり聞いているのと同じ効果がある).この結果をまとめ,今後,報告予定である.
|