本研究は、高齢者が、いつでも、どこでも使うことができる音声認識システムを構築することを目指し、認識率向上のために高齢者音声の特徴を明らかにするのが目的である。当年度は昨年度に引続き、高齢者の代表的な静的音響特徴(嗄声)と動的特徴(いわゆるメリハリの無さ)の性質をさらに精密に調べた。 嗄声に関しては、話者の発声器官の寸法差の影響を軽減するために、声道長の正規化を行った。これによって、話者の個人差の影響を除き、年齢と嗄声度の関係をより明確にすることが可能になった。その結果、男声においては、20代〜50代の一般成人と、60代、70代の高齢者のスペクトルには顕著な違いがあり、高齢者においては嗄声度に対応して4kHz以上のスペクトルが上昇することが確認できた。一方、女声においては、高齢者のほうが一般成人よりもスペクトルの高域が多少上昇する傾向はあるが、それほど顕著な差は認められなかった。高齢者音声のみの聴取実験においても女性話者の榎声の聴き分けは難しく、高齢化に伴う嗄声化は主に男声の特徴であることが判明した。 動的特徴であるメリハリ度に関しては、昨年度提案したパワーおよびスペクトルの時間変化速度・変化幅のより正確な検討と、それに加え、フォルマント周波数の変位量を調べた。聴感的メリハリ度とF1-F2平面上の音素配置の関係は、男女声共に、聴感的メリハリ度が小さくなるほど、音素間の距離が小さくなる傾向が明確に現れた。ただし、メリハリ度は発声速度の影響を強く受けることもわかり、発声速度を正規化した評価が必要になる。 高齢者の特徴を補正して一般成人に適合させれば、高齢者音声の認識率が向上することを確認している。今後は、高齢者音声の音響的特徴を、嗄声とメリハリのみでなく、より幅広く検討すると共に、認識システムへの適用を進める。
|