研究概要 |
多言語音声としては6言語(日本語,中国語,韓国語,英語,ドイツ語,フランス語)を,日本語方言音声データとしては,すでに整備していた「方言談話資料」12地点に加えて「天気予報」8地点分を選んだ. 音声データから,音声の基本周波数(F_0)を抽出し,韻律的特徴を捉えるために,F_0の時間的変化を折線で近似する.次に,F_0と音声パワーの短時間相関係数,折線の係数,開始周波数について平均値,標準偏差など21〜26種のパラメータを求める.また.折線の代わりに,指数関数と直線を組み合わせたモデルによる近似手法も取り入れた.最後に,これらの統計量を説明変量として主成分分析と判別分析を行い,多言語音声と方言音声の識別を行った. 多言語音声において,第7主成分までの累積寄与率は80%に達している.6言語の電話音声について,判別分析により63%(1サンプル取って置き法)の識別率が得られた.日本語方言については,「天気予報」8地点,各男女計8名について1サンプル取って置き法で32%の識別率が得られた. 最終年度は,「天気予報」8地点について音韻情報を用いて方言音声の分類を試みた.音韻特徴として,日本語の5母音について,第1〜第4ホルマント(F_1〜F_4)を抽出した.音声は,各方言で男性話者3名,一人2文で15秒程度の発話である.全ての方言を各母音ごとに,F_1-F_1,F_2-F_3,F_3-F_4のグラフに表して,比較した.各母音について,3方言は一個所に多くまとまっているが,他は分散している.8方言中の2方言の全28の組合わせのうち,18の組合わせで75%以上が分類可能であるという結果が得られた.
|