2002 Fiscal Year Annual Research Report
Project/Area Number |
12132102
|
Research Institution | The University of Tokyo |
Principal Investigator |
藤崎 博也 東京大学, 大学院・工学系研究科, 名誉教授 (80010776)
|
Co-Investigator(Kenkyū-buntansha) |
大野 澄雄 東京工科大学, 工学部, 助教授 (80256677)
前川 喜久雄 独立行政法人国立国語研究所, 研究開発部門・第2領域, 領域長(研究職) (20173693)
窪薗 晴夫 神戸大学, 文学部, 教授 (80153328)
|
Keywords | 韻律 / 韻律の定式化 / 韻律のモデル化 / 言語情報 / 日本語のリズム / パラ言語情報 / 非言語情報 / 感情 |
Research Abstract |
1.言語情報と音声の韻律的特徴との間の関係の分析、定式化およびモデル化 研究代表者が創案した基本周波数パターンの生成過程のモデルは、すでに多くの言語に関して適用性が実証されているが、今年度は新たに声調言語としてのタイ語および非声調言語としてのポルトガル語の音声に関して検討を行い、その妥当性を実証した。また、実測された基本周波数パターンから、その生成過程のモデルのパラメータを自動的に抽出するための手法を考案し、その有効性を日本語および英語の音声に関して実証した。 2.言語情報と音声の時間構造との間の関係の分析、定式化及びモデル化 時間制御の見地から、音節方言とされる鹿児島方言と東京方言とを音響分析により比較・考察した。鹿児島方言では、非促音に対する促音の長さが東京方言ほどではなく、促音前の母音が長くなり、促音後の母音が顕著に短縮する傾向が見られる。その結果、鹿児島方言では東京方言のようなモーラ数に比例した単語長の伸びは見られず、開音節と閉音節がほぼ同じ長さを持つ傾向を示すことが明らかとなった。 3.パラ言語情報と音声の韻律的との間の関係の分析、定式化及びモデル化 パラ言語情報が指定されることに伴う喉頭音源の変化を、声帯振動の高速ビデオ画像とFFTによる音響分析によって検討し、「落胆」では息漏れ発声、「疑い」ではきしみ発声のように、声質の変化が生じていることを確認した。また、パラ言語情報に配慮した自発音声のイントネーションラベリング体系X-JToBIを考案し、その精度を定量的に評価した。 4.話者の感情に関する情報と音声の韻律的特徴との間の関係の分析、定式化及びモデル化 すでに提案した4次元8種類の感情の分類に従い、それぞれの種類の感情の強さを強・中・弱の3通りに変えた発話に中立の発話を加え、合計25種類の音声資料を収集した。つぎにそれらを刺激として、感情の種類の識別、および感情の強さの弁別に関する聴取実験を行い、感情の種類の識別においては、種類により識別精度にかなり大きな差異があること、また、感情の強さの弁別においては今回用意した3段階程度の粗い差異は完全に弁別されることを確認した。
|
-
[Publications] Fujisaki, Hiroya: "Modeling of the tonal features of speech with application to multilingual speech synthesis"Proceedings of the Joint International Conference of SNLP-Oriental COCOSDA 2002. D1-D10 (2002)
-
[Publications] Narusawa, Shuichi: "A method for automatic extraction of model parameters from fundamental frequency contours of speech"Proceedings of ICASSP 2002. 2. 509-512 (2002)
-
[Publications] 成澤修一: "音声の基本周波数パターン生成過程モデルのパラメータ自動抽出法"情報処理学会論文誌. 43・7. 2155-2168 (2002)
-
[Publications] Fujisaki, Hiroya: "A preliminary study on the modeling of fundamental frequency contours of Thai utterances"Proceedings of 2002 International Conference on Signal Processing. 1. 516-519 (2002)
-
[Publications] Narusawa, Shuichi: "Automatic extraction of model parameters from fundamental frequency contours of English utterances"Proceedings of 2002 International Conference on Spoken Language Processing. 3. 1725-1728 (2002)
-
[Publications] 藤崎博也: "タイ語音声の基本周波数パターンの生成過程のモデル化"日本音響学会2002年秋季研究発表会講演論文集. 1. 337-338 (2002)
-
[Publications] 藤崎博也: "ポルトガル語音声の基本周波数パターンの分析とその生成過程のモデル化"日本音響学会2003年春季研究発表会講演論文集. 1. 301-302 (2003)
-
[Publications] Kubozono, Haruo: "Prosodic structure of loanwords in Japaneses : Syllable structure, accent and morphology"音声研究. 6・1. 79-97 (2002)
-
[Publications] Kubozono, Haruo: "Temporal neutralization in Japanese"Paper in Laboratory Phonology. 7. 171-201 (2002)
-
[Publications] 窪薗晴夫: "鹿児島方言におけるアクセントの変化"國文學. 2003年3月号. 46-52 (2003)
-
[Publications] Maekawa, Kikuo: "X-JToBI : An extended J_ToBI for spontaneous speech"Proceedings of 2002 International Conference on Spoken Language Processing. 3. 1545-1548 (2002)
-
[Publications] 前川喜久雄: "パラ言語情報研究の課題"日本音響学会2002年秋季研究発表会講演論文集. 1. 247-250 (2002)
-
[Publications] 藤本雅子: "発生様式に及ぼすパラ言語情報の影響-高速ビデオ画像の解析-"日本音響学会2002年秋季研究発表会講演論文集. 1. 257-258 (2002)
-
[Publications] 菊池英明: "自発音声韻律ラベリングスキームX-JToBIの能力検証"人口知能学会研究会SIG-SLUD. A-202-06. 33-36 (2002)
-
[Publications] 大野澄雄: "感情の心理学的分類とその音声表現における韻律的特徴の分析"Proceedings for 2002 2nd Plenary Meeting and Symposium on Prosody and Speech Processing. 5-8 (2003)
-
[Publications] 窪薗晴夫: "音節とモーラ"研究社出版. 202 (2002)