研究概要 |
音声中に含まれる個人性は,声道の伝達特性に由来するスペクトル包絡や声帯振動に由来するスペクトル微細構造に含まれている.このうち,スペクトル包絡情報に関連した特徴量が,話者認識に広く利用されている.これらの特徴量は,個人性情報を多く含んでいる上に,発声者が意図的に変えることが困難であると言われている.しかし一方で,伝送系や雑音,環境騒音などの影響を受けやすいことも知られている. スペクトル微細構造に関連した特徴量として,声の高さや大きさ,話す速さや話し方などの韻律情報がある.これらは発声者が容易に変えることができる特徴量であるため,これまで話者認識には積極的に利用されることは少なかったが,伝送系や雑音,環境騒音などの影響を受けにくいなどの利点があるため最近注目されつつある. この韻律情報は,発声者が意図的に変化させることができる特徴量ではあるものの,その変動幅にも個人差が存在すると考えることができる.そこで,本研究では,発声様式の異なる発話における基本周波数の頻度分布が,話者や発声様式の違いによって受ける影響を検証した.また、同じ言葉を話すときに,同じ人であれば同じような話し方をする傾向が強いので、テキスト依存型話者照合における話し方を利用する手法についても検討した.更に、話者認識に有効となる特徴量変換を提案した. 本研究によって,韻律情報に含まれる個人性情報やそれを利用した話者認識手法を示すことができ,更には,話者認識に有効な特徴量変換を導入することによって,話者認識性能の向上に寄与できるものと考える.
|