研究課題/領域番号 |
01420028
|
研究種目 |
一般研究(A)
|
配分区分 | 補助金 |
研究分野 |
電子通信系統工学
|
研究機関 | 東京工業大学 |
研究代表者 |
今井 聖 東京工業大学, 精密工学研究所, 教授 (50016763)
|
研究分担者 |
古市 千枝子 東京工業大学, 精密工学研究所, 助手 (90016783)
|
研究期間 (年度) |
1989 – 1990
|
研究課題ステータス |
完了 (1990年度)
|
配分額 *注記 |
17,400千円 (直接経費: 17,400千円)
1990年度: 500千円 (直接経費: 500千円)
1989年度: 16,900千円 (直接経費: 16,900千円)
|
キーワード | セグメンテ-ション / ラベリング / 音素認識 / 連続音声認識 / 大語彙 / 単語音声認識 / 単語スポッティング / 会話レベル / 音声デ-タベ-ス / 会話速度 |
研究概要 |
平成2年度の研究実施計画に沿って研究実績を記述する。 (1)パタ-ンマッチングにおける標準パタ-ンの予備選択法の検討は…… 音素の認識の前処理として音素的単位セグメンテ-ションを行う場合には、各音素に対応する複数のテンプレ-トを用意することになるが、標準パタ-ン全体のデ-タ量は比較小さくパタ-ンマッチングのための処理量もそれ程多くはないので、特定話者対象の場合にはとくに問題はないことが確かめられた。不特定話者対応とする場合にま母音と出現頻度の多い音素についてはテンプレ-トの選択を行い、標準パタ-ンの数を減らすことがシステムの簡単化と処理の高速化に有効であることが確かめられた。母音等の音素標準パタ-ンの数を従来のマルチテンプレ-トの方法に比べ約十分の一にする方法を提案した。 (2)今話速度連続音声認識システケの実現と評価…… 本格的システム構成の準備として、大語彙単語音声認識システムを本研究の方式によって構成し、認識実験を行った。ヤグメンテ-ションに基づいて音素認識を行い、それによって得た音素ラティスと辞書による音素記号別とのマッチングにより単語認識を行うものであるが、1642語の単語辞書に対し、第一候補認識率は96.8%であり、第三候補に正解を含む形の認識率は98.5%である。現在、文章レベルの連続音声中の単語あるいは文節の認識システムを構成し、認識実験を行っている。従来の単語スポッティングと異なり、大語彙の場合にもかなり高い認識率を得ており、しかも処理量が従来の方法に比べ著しく小さい。文章レベルの連続音声に対しては大語彙の基本単語のスポッティングを初めに行い、次に語尾や付属語の認識を行うようにしている。
|