1989 Fiscal Year Annual Research Report
会話速度連続音声の音素的単位セグメンテ-ションと認識
Project/Area Number |
01420028
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
今井 聖 東京工業大学, 精密工学研究所, 教授 (50016763)
|
Co-Investigator(Kenkyū-buntansha) |
古市 千枝子 東京工業大学, 精密工学研究所, 助手 (90016783)
|
Keywords | 連続音声認識 / 単語音声認識 / 音素認識 / 大語彙 / セグメンテ-ション / ラベリング / 音声デ-タベ-ス / 会話速度 |
Research Abstract |
平成1年度の研究実施計画に沿って研究実績を記述する。 (1)会話速度連続音声認識のための音素的単位セグメンテ-ションの方法の検討………連続音声に対する音素的単位セグメンテ-ションシステムを既に得ているので、これを会話速度連続音声の認識の前処理に利用する場合の問題を明らかにし、システムの改良を行った。検討の結果、本システムは不特定話者の連続音声に対し有効であることが確かめられた。発声速度が比較的遅い朗読速度の連続音声は勿論、非常に速い会話速度の連続音声にも対応できることを確かめた。日本語音声に対しては本システムの性能は十分であると考えられるが、子音連鎖の多い英語などヨ-ロッパ言語に対応できるよう無声音区間のセグメンテ-ションの性能を向上させた。 (2)セグメンテ-ションシステムを利用する音声デ-タベ-スの半自動作成………音声デ-タベ-ス作成においては、セグメンテ-ションとラベリングが作成者にとって極めて負担の大きな作業であるが、多少のエラ-を許容すればこの部分の作業を自動化することができる。セグメンテ-ションとラベリングを一応自動的に行い、結果を人間が修正し確認する形の音声デ-タベ-ス作成のソフトウェアを開発した。 (3)標準パタ-ンの半自動作成法の検討………音素的単位セグメンテ-ションを利用して、標準パタ-ンセットの自動作成が一応可能になったが、やはり最終チェックは人間が行う必要がある。数多くの複数標準パタ-ンの数の圧縮の方法の確立が重要な課題となった。 (4)連続単語音声認識システムの実現と評価………セグメンテ-ションと音素認識に基づく単語認識システムを構成して、極めてよい結果を得た。セグメンテ-ションシステムから得られる音素記号別を辞書の単語の音素記号列と照合する方式で大語彙単語認識に拡張できる。
|
-
[Publications] 徳田恵一,小林隆夫,今井聖,斎藤博徳: "メルケプストラムをパラメ-タとする音声のスペクトル推定" 電子情報通信学会技術報告. DSP89ー17. 67-74 (1989)
-
[Publications] 古市千枝子,今井聖: "多様な音韻環境における音素的単位のセグメンテ-ション" 電子情報通信学会論文誌. J72ーDーII. 1221-1227 (1989)
-
[Publications] 徳田恵一,小林隆夫,深田俊明,今井聖: "適応メルケプストラム分析による音声信号処理" 電子情報通信学会技術報告. SP89ー61. 49-56 (1989)
-
[Publications] K.Tokuda,T.Kobayashi,S.Shiomoto,S.Imai: "Adaptive Filtering Based on Cepstral RepresentationーAdaptive Cepstral Analysis of Speech" Proc.ICASSP-90(IEEE主催音響音声信号処理国際会議). 4ペ-ジ (1990)
-
[Publications] 古市千枝子,今井聖: "特定話者任意語彙連続音声の音素認識" 電子情報通信学会論文誌. J73ーDーII. 11ペ-ジ (1990)
-
[Publications] Satoshi IMAI,Chieko FURICHI: "Automatic Segmentation of Continuous Japanese Speech into Phonemic Units." Proc.EUSIPCO-90(ヨ-ロッパ信号処理学会主催国際会議). 4ペ-ジ (1990)