1990 Fiscal Year Annual Research Report
会話速度連続音声の音素的単位セグメンテ-ションと認識
Project/Area Number |
01420028
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
今井 聖 東京工業大学, 精密工学研究所, 教授 (50016763)
|
Co-Investigator(Kenkyū-buntansha) |
古市 千枝子 東京工業大学精密工学研究所, 助手 (90016783)
|
Keywords | セグメンテ-ション / ラベリング / 音素認識 / 連続音声認識 / 大語彙 / 単語音声認識 / 単語スポッティング |
Research Abstract |
平成2年度の研究実施計画に沿って研究実績を記述する. (1)パタ-ンマッチングにおける標準パタ-ンの予備選択法の検討…… 音素の認識の前処理として音素的単位セグメンテ-ションを行う場合には,各音素に対応する複数のテンプレ-トを用意することになるが,標準パタ-ン全体のデ-タ量は比較小さくパタ-ンマッチングのための処理量もそれ程多くはないので,特定話者対象の場合にはとくに問題はないことが確かめられた.不特定話者対応とする場合には母音と出現頻度の多い音素についてはテンプレ-トの選択を行い,標準パタ-ンの数を減らすことがシステムの簡単化と処理の高速化に有効であることが確かめられた.母音等の音素標準パタ-ンの数を従来のマルチテンプレ-トの方法に比べ約十分の一にする方法を提案した. (2)今話速度連続音声認識システムの実現と評価…… 本格的システム構成の準備として,大語彙単語音声認識システムを本研究の方式によって構成し,認識実験を行った.セグメンテ-ションに基づいて音素認識を行い,それによって得た音素ラティスと辞書による音素記号別とのマッチングにより単語認識を行うものであるが,1642語の単語辞書に対し,第一修補認識率は96.8%であり,第三修補に正解を含む形の認識率は98.5%である.現在,文章レベルの連続音声中の単語あるいは文節の認識システムを構成し,認識実験を行っている.従来の単語スポッティングと異なり,大語彙の場合にもかなり高い認識率を得ており,しかも処理量が従来の方法に比べ著しく小さい。文章レベルの連続音声に対しては大語彙の基本単語のスポッティングを初めに行い,次に語尾や付属語の認識を行うようにしている.
|
-
[Publications] 古市 千枝子,今井 聖: "多様な音韻環境における音素的単位のセグメンテ-ション" 電子情報通信学会論文誌DーII. J72ーDーII. 1221-1227 (1989)
-
[Publications] 古市 千枝子,今井 聖: "特定話者任意語い連続音声の音素認識" 電子情報通信学会論文誌DーII. J73ーDーII. 501-511 (1990)
-
[Publications] 徳田 恵一,小林 隆夫,塩本 祥司,今井 聖: "適応ケプストラム分析ーケプストラムを係数とする適応フィルター" 電子情報通信学会論文誌A. J73ーA. 1207-1215 (1990)
-
[Publications] 古市 千枝子,谷口 一郎,今井 聖: "音素を単位とする任意単語音声の認識" 電子情報通信学会論文誌DーII.
-
[Publications] K.Tokuda,T.Kobayashi,S.Shiomoto,S.Imai: "Adaptive Filtering Based on Cepstral RepresentationーAdaptive Cepstral Analysis of Speech" Proc.of ICASSP 90ー1990 International Conference on Acoustics,Speech,and Signal Processing.(S7.2). 377-380 (1990)
-
[Publications] S.Imai,C.Furuichi: "Automatic Segmentation of Continuous Japanese Speech into Phonemic Units" Proc.of EUSIPCOー90ーFifth European Signal Processing Conference.1355-1358 (1990)