1994 Fiscal Year Annual Research Report
音声の韻律的特徴の定式化とその連続音声認識への利用
Project/Area Number |
06452397
|
Research Category |
Grant-in-Aid for General Scientific Research (B)
|
Research Institution | The University of Tokyo |
Principal Investigator |
広瀬 啓吉 東京大学, 工学部, 教授 (50111472)
|
Co-Investigator(Kenkyū-buntansha) |
大野 澄雄 東京理科大学, 基礎工学部, 助手 (80256677)
|
Keywords | 韻津的特徴 / 連続音声認識 / 韻律規則 / 時間構造 / アクセント型 / 統語境界 / 基本周波数パターン / 部分AbS法 |
Research Abstract |
本研究は、まず連続音声の韻律的特徴を定式化し、次にこれを利用して単語の同定、文法的境界の検出等を行う手法を開発し、さらにこれらを連続音声の認識に利用する有効な方策を考案して連続音声認識の性能向上を図ることを目的とする。本年度は、韻律規則の構築とそれに基づく統語境界検出、誤認識検出に重点をおいて以下の成果を達成した。 1.ニュース文、ナレーション文について、音声の基本周波数パターンを分析し、統語境界とフレーズ成分の関係、アクセント型・語の重要度とアクセント成分の関係を調べ、従来、テキスト音声合成システム用に作成した韻律規則の見直しと修正・改良を行った。 2.HMMにもとづく音声認識において、時間構造に着目してクラスタリングを行う手法を提案して効果を確認した。 3.連続音声認識において、該当音素の認識結果に前後の音素認識結果の尤度を反映させる手法を開発した。 4.同一文字言語表現の対話音声と朗読音声を収録し、韻律的特徴の異同を分析した。その結果、対話音声における基本周波数値の上昇と分散の拡大、発話速度の上昇と文中での変動の傾向等を明らかにした。話者の意図・感情に関しても分析を行い、感情により基本周波数パターンに低下傾向が見られなくなることなどを示した。 5.基本周波数パターンとその大局的特徴を利用して連続音声の文法的境界を検出する手法を開発し、パターンの概形に関する知識を導入することによって検出精度の向上を達成した。次に各認識候補に対し、それに対応する基本周波数パターンを上記1.の韻律規則から生成し、観測パターンとの比較によって確からしさを推定する手法を開発した。新しく開発した部分AbS法により比較を行い、アクセント型の変化、統語境界の変化を伴う誤認識検出に有効であることを示した。
|
Research Products
(14 results)
-
[Publications] Sumio Ohno: "A method for efficient DP matching in spoken word recognition" Proc.International Symposium on Speech,Image Processing & Neural Networks. 714-717 (1994)
-
[Publications] 胡新輝: "標準中国語二音節語における声調認識の検討" 電子情報通信学会技術研究報告(音声研究会). 29-36 (1994)
-
[Publications] Keikichi Hirose: "Use of fundamental frequency contours for the improvement of continuous speech recognition" Proc.on 1994 Japan-China Symposium on Advanced Information Technology. 63-68 (1994)
-
[Publications] Xin-hui Hu: "Study on tone recognition of standard Chinese monosyllabic and disyllabic speech using HMM" Proc.on 1994 Japan-China Symposium on Advanced Information Technology. 77-84 (1994)
-
[Publications] Keikichi Hirose: "Analysis and synthesis of fundamental frequency contours for the spoken dialogue in Japanese" Proc.2nd ESCA/IEEE Workshop on Speech Synthesis. 167-170 (1994)
-
[Publications] Nobuaki Minematsu: "Speech recognition using HMM with decreased intra-group variation in the temporal structure" Proc.International Conference on Spoken Language Processing. 1. 187-190 (1994)
-
[Publications] Xinhui Hu: "Recognition of Chinese tones in monosyllabic and disyllabic speech using HMM" Proc.International Conference on Spoken Language Processing. 1. 203-206 (1994)
-
[Publications] Keikichi Hirose: "Use of prosodic features in the recognition of continuous speech" Proc.International Conference on Spoken Language Processing. 3. 1123-1126 (1994)
-
[Publications] Sumio Ohno: "A method for word spotting in continuous speech using both segmental and contextual likelihood scores" Proc.International Conference on Spoken Language Processing. 4. 2199-2202 (1994)
-
[Publications] 胡新輝: "中国語多音節語の声調認識の検討" 日本音響学会秋季研究発表会講演論文集. I. 193-194 (1994)
-
[Publications] 峯松信明: "HMMに対する音声の時間構造の記述に関する検討" 日本音響学会秋季研究発表会講演論文集. I. 199-200 (1994)
-
[Publications] 広瀬啓吉: "音声処理研究とプロソディー" 日本音響学会秋季研究発表会講演論文集. I. 299-302 (1994)
-
[Publications] 胡新輝: "基本周波数とパワーに関するコードブックを用いた中国語多音節の声調認識" 日本音響学会春季研究発表会講演論文集. I. 107-108 (1995)
-
[Publications] 桜井淳宏: "部分AbS方式を用いた統語境界の高精度推定" 日本音響学会春季研究発表会講演論文集. I. 23-24 (1995)