1996 Fiscal Year Annual Research Report
Project/Area Number |
07458065
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Research Institution | University of Tsukuba |
Principal Investigator |
板橋 秀一 筑波大学, 電子・情報工学系, 教授 (70151454)
|
Co-Investigator(Kenkyū-buntansha) |
横山 晶一 山形大学, 工学部, 教授 (20250946)
山本 幹雄 筑波大学, 電子・情報工学系, 講師 (40210562)
|
Keywords | 多言語 / 方言 / 音声 / 指数関数近似 / 基本周波数 / 折れ線近似 / 主成分 / 判別分析 |
Research Abstract |
本年度は、音声の特徴として韻律情報を利用し、多言語音声と日本語方言音声に対してそれぞれ同じ手法を用いて識別実験を行った。 多言語や日本語方言の音声データから、まず、音声の基本周波数(F_0)を抽出する。次に、韻律的特徴を捉えるために、F_0の時間的変化を折れ線で近似する。また、折れ線の代わりに、指数関数と直線を組み合わせたモデルによる近似手法もとり入れた。続いて、F_0と音声パワーの短時間相関係数、折れ線や指数関数モデルの係数、開始周波数について平均値、標準偏差などの統計量を求める。最後に、これらの統計量を説明変量として主成分分析と判別分析を行い、多言語音声と方言音声の識別を行う。 多言語音声識別の対象言語は、日本語、中国語、韓国語、(アメリカ)英語、フランス語、ドイツ語の6言語とした。音声データは昨年度迄に入手した読み上げ音声CD-ROMから1話者当たり96秒で計48名の男女話者、電話音声コーパスから1話者当たり45秒で計382名の男女話者のデータを選択した。 日本語方言音声データには、天気予報文読み上げ音声CDから8地点について1話者当たり50秒で計64名の男女話者、自由会話を収めたカセットテープから12地点について1話者当たり110秒で計49名の男女話者を利用した。 主成分分析および判別分析の結果、韻律情報により多言語音声・日本語方言音声の識別が可能なことを示した。
|
-
[Publications] 板橋秀一: "音声データベースの展望" 音声学会会報. 第211号. 56-62 (1996)
-
[Publications] 笹沼、板橋: "基本周波数による多言語音声の分類" 音声研究会 信学技報. SP96-57. 13-20 (1996)
-
[Publications] 笹沼、板橋: "韻律情報を用いた多言語音声の分類" 日本音響学会講演論文集. 3-6-14(発表予定). (1997)
-
[Publications] 上田、板橋: "音声対話コーパスの比較・選択の一方法" 日本音響学会講演論文集. 2-Q-8(発表予定). (1997)
-
[Publications] 山本幹雄: "曖昧観測シンボル列からのHMMパラメータ推定法とその形態素解析への応用" 情報処理学会研究報告. NL113-2. 7-12 (1996)
-
[Publications] 横山、佐久間: "意味素性を用いた複合名詞の生成による分析" 計量国語学. 20-7. 304-314 (1996)