音声の基本周波数を用いて、方言音声の識別を行うことを試みた。声の高さの情報に関連する音声の基本周波数の時間的変化パターンを折れ線で近似し、その傾斜と開始周波数によって方言の特徴を抽出する。このための資料として茨城県水戸市の男女各1名の話者について方言音声を収録した。方言音声としては、その他にNHKアナウンサーおよび特徴のある5種の方言群の中から計8種の音声(男性)を用いた。内容は童話の「桃太郎」の一部を読み上げたものである。 分析方法は平均振幅差関数(AMDF)法により基本周波数を求め、ある一定値以上の音声パワーを持つ部分を取り出す。その区間について、音声の基本周波数の時間的変化パターンを動的計画法(DP)により折れ線で最小2乗誤差近似する。折れ線の傾き、開始周波数、持続時間等の平均値・分散等を求める。折れ線の開始周波数については、話者の個人差の影響を受けるので、折れ線で近似した全区間の基本周波数の平均値で割って正規化した相対開始周波数を特徴パラメータとして用いる。近似折れ線の数は各方言にについて約165本であり、その傾斜は1フレーム(10ms)当たり±10HZの範囲を変動している。相対開始周波数は0.4から2.0の範囲にあること等が分かった。これに基づいて、相対開始周波数と折れ線の傾きの平均値により、5種の方言群を分類できることに示した。
|