研究概要 |
本研究の最終的な目標は,話者の感性情報をも視聴者へ提示可能な高品位高感性音声提示システムを構築することにある。そのために本研究では,話者映像の有無や,話速といった話声の性質,話者映像と話声の同期,話者の口の動きといったパラメータが,音韻知覚及び視聴者の感性情報にどのような影響を及ぼすか定量的に明らかにし,得られた知見に基づいて,感性情報を効率的に伝送可能な高感性音声提示システムの構築手法を提案する。 平成21年度は,前年度に引き続き,音声の聴き取りに対する話速の影響に注目し,高齢者の音声知覚における話者映像と音声のずれの影響を検討した。映像と音声の時間長が異なることにより両者にズレが生じた場合でも,高齢者の方がズレに左右されずに高い単語了解度を示すことは前年度末に明らかとなっており,その原因を探るべく,時間伸長音声を用いて話者映像と音声のずれの検知限,許容限を測定した。その結果,高齢者は若齢者に比べ,映像と音声の時間ずれの検知が困難であり,その結果,ずれに寛容であることが明らかとなった。前年度の結果とあわせて考えると,ユニバーサルデザイン指向の音声提示システムを構築する際には,音声の聴き取りを向上させるために「話速をゆっくりする」ことが重要であり,その際に映像と音声がずれたとしても,感性情報を損ねることなく伝送することが可能となること示唆している。 以上研究結果から,高精度高感性視聴覚音声提示システムの構築に向けての設計指針となりうる知見が得られたと考えている。
|