今年度は、昨年度までの研究のとりまとめと共に、重度脳性マヒ児の発声する不明瞭・不安定な音を入力とした場合、どの程度、音声認識装置で認識できるかの研究を行った。これは、不随意運動に基づく不安定な音声の中に、どの程度安定な部分があるかを見るためである。昨年までの被験者の内の語音明瞭度約21%の一名について、6ヶ月間にわたり再度音声資料の採取を行った。採取した音声資料に、発声音前後の雑音区間の除去、低周波フィルターにより4.9kHz以上の高周波数成分の除去の処理を行い、学習用音声資料並びに認識実験用音声資料を作成した。昨年度は、50音について研究・調査を行ったが、本年度は、更に18音追加して68音について研究を行った。使用した音声認識装置は、三洋電機(株)より提供を受けたVFF-100Pで、不特定話者対応、学習機能付きのもので、入力音声に対して認識第1位候補から第10位候補までを出力するものである。第1位候補が正しければ、いわゆる正答になる。30日分の資料を学習した時点で、第1位候補が正答である割合は40%程度あり、人間の耳による認識率21%の2倍近い値を示した。また、4回同じ音を発声した場合、第1位の正しい答が得られる割合は80%にも達することが明らかになった。以上の結果は、不随意運動に伴う不安定な音声も、その音響パラメータの計測や、音声認識装置による認識実験により、不安定の程度を計測することにより、不随意運動による不安定な動作を克服する方法があることを示すものである。(人間の耳による)語音明瞭度21%の児童に(見かけ上の)音声認識率80%の機械を提供できる可能性を示したことは、本年度の研究の成果である。
|