研究課題/領域番号 |
07458065
|
研究種目 |
基盤研究(B)
|
研究機関 | 筑波大学 |
研究代表者 |
板橋 秀一 筑波大学, 電子・情報工学系, 教授 (70151454)
|
研究分担者 |
横山 晶一 山形大学, 工学部, 教授 (20250946)
山本 幹雄 筑波大学, 電子・情報工学系, 講師 (40210562)
|
キーワード | 多言語 / 方言 / 音声 / 指数関数近似 / 基本周波数 / 折れ線近似 / 主成分 / 判別分析 |
研究概要 |
本年度は、音声の特徴として韻律情報を利用し、多言語音声と日本語方言音声に対してそれぞれ同じ手法を用いて識別実験を行った。 多言語や日本語方言の音声データから、まず、音声の基本周波数(F_0)を抽出する。次に、韻律的特徴を捉えるために、F_0の時間的変化を折れ線で近似する。また、折れ線の代わりに、指数関数と直線を組み合わせたモデルによる近似手法もとり入れた。続いて、F_0と音声パワーの短時間相関係数、折れ線や指数関数モデルの係数、開始周波数について平均値、標準偏差などの統計量を求める。最後に、これらの統計量を説明変量として主成分分析と判別分析を行い、多言語音声と方言音声の識別を行う。 多言語音声識別の対象言語は、日本語、中国語、韓国語、(アメリカ)英語、フランス語、ドイツ語の6言語とした。音声データは昨年度迄に入手した読み上げ音声CD-ROMから1話者当たり96秒で計48名の男女話者、電話音声コーパスから1話者当たり45秒で計382名の男女話者のデータを選択した。 日本語方言音声データには、天気予報文読み上げ音声CDから8地点について1話者当たり50秒で計64名の男女話者、自由会話を収めたカセットテープから12地点について1話者当たり110秒で計49名の男女話者を利用した。 主成分分析および判別分析の結果、韻律情報により多言語音声・日本語方言音声の識別が可能なことを示した。
|