1995 Fiscal Year Annual Research Report
音声の韻律的特徴の定式化とその連続音声認識への利用
Project/Area Number |
06452397
|
Research Institution | The University of Tokyo |
Principal Investigator |
広瀬 啓吉 東京大学, 大学院・工学系研究科, 教授 (50111472)
|
Co-Investigator(Kenkyū-buntansha) |
大野 澄雄 東京理科大学, 基礎工学部, 助手 (80256677)
|
Keywords | 韻律的特徴 / 連続音声認識 / 韻律規則 / 部分Abs / フレーズ境界 / 基本周波数パターン / アクセント型 / HMM |
Research Abstract |
本研究は、まず連続音声の韻律的特徴を定式化し、次にこれを利用して単語の同定、文法的境界の検出等を行う手法を開発し、さらにこれらを連続音声の認識に利用する有効な方策を考案して連続音声認識の性能向上を図ることを目的とする。本年度は、韻律の合成的手法によるフレーズ境界検出に重点をおいて以下の成果を達成した。 1.同一文字言語表現の対話音声と朗読音声を収録し、韻律的特徴の異同を分析した。その結果、対話音声における基本周波数パターンを構成するフレーズ・アクセント成分の大きさが語の役割などの要因によってどの様に変化するかを数量的に示した。また、発話速度の1文中での変化傾向を明らかにした。これらの結果から、対話音声に対する韻律規則を構築し、対話中での重要な語句の検出手法を作成した。 2.各認識候補に対し、それに対応する基本周波数パターンを韻律規則から精製し、観測パターンと部分AbSによって比較して、候補の確からしさを推定する手法を前年度開発したが、それについて、フレーズ境界の検出性能を詳細に調べ、方式の改良を行った。 3.基本周波数パターンを時間波形とみなした上で、低域フィルタリングを行ってアクセント成分を抑圧し、フレーズ成分の立ち上がりを精度良く抽出する手法を提案した。また、抽出位置から音声波形上のフレーズ境界位置を求めるために、両者の対応を調べ、補正関数を定めた。 4.HMMにもとづく音声認識において、時間構造に着目してクラスタリングを行う手法を提案して効果を確認した。また、連続音声認識において、該当音素の認識結果に前後の音素認識結果の尤度を反映させる手法を開発した。 5.基本周波数パターンと波形パワーを特徴量としたHMMにより単語のアクセント型を自動識別する手法を開発した。
|
-
[Publications] 阪田真弓: "対話音声の韻律的特徴の分析と合成" 電子情報通信学会技術研究報告(音声研究会). I. 55-62 (1995)
-
[Publications] 峯松信明: "Duration modeling with decrteased intra-group temporal variation for HMM-based phoneme recognition" IEICE Trans. Information and Systems. E78-D. 654-661 (1995)
-
[Publications] 胡新輝: "Tone recognition of Chinese dissyllables using hidden Markov models" IEICE Trans. Information and Systems. E78-D. 685-691 (1995)
-
[Publications] 大野澄雄: "A scheme for word detection in continuous speech using likelihood scores of segments modified by their context within a word" IEICE Trans. Information and Systems. E78-D. 725-731 (1995)
-
[Publications] 峯松信明: "Role of prosodic features in the human process of perceiving spoken words and sentences in Japanese" J.Acoust.Soc.Japan(E). 16. 311-320 (1995)
-
[Publications] 広瀬啓吉: "HMM-based recognition of Chinese trisyllables using double codebooks of fundamental frequency and waveform power" Proc.European Conference on Speech Communication and Technology. 1. 31-34 (1995)
-
[Publications] 阪田真弓: "Analysis and synthesis of prosodic features in spoken dialogue of Japanese" Proc.European Conference on Speech Communication and Technology. 2. 1007-1010 (1995)
-
[Publications] 桜井淳宏: "部分AbS方式による統語境界位置の推定に関する検討" 日本音響学会秋季研究発表会講演論文集. I. 99-100 (1995)
-
[Publications] 阪田真弓: "対話音声と朗読音声における基本周波数パターンの特徴の比較" 日本音響学会秋季研究発表会講演論文集. I. 211-212 (1995)
-
[Publications] 桜井淳宏: "基本周波数パターンの部分AbS方式によるフレーズ境界の推定に関する検討" 電子情報通信学会技術研究報告(音声研究会). I. 7-12 (1995)
-
[Publications] 桜井淳宏: "部分AbS方式によるフレーズ境界推定の検討" 日本音響学会春季研究発表会講演論文集. I(発表予定). (1996)
-
[Publications] 桜井淳宏: "基本周波数パターンのフィルタリングに基づくフレーズ指令の自動抽出" 日本音響学会春季研究発表会講演論文集. I(発表予定). (1996)
-
[Publications] 広瀬啓吉: "Detection of syntactic boundaries by partial analysis-by-synthesis of fundamental frequency contours" Proc.IEEE International Conference on Acoustics, Speech, & Signal Processing. (発表予定). (1996)