研究課題/領域番号 |
06452397
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 東京大学 |
研究代表者 |
広瀬 啓吉 東京大学, 大学院・工学系研究科, 教授 (50111472)
|
研究分担者 |
大野 澄雄 東京理科大学, 基礎工学部, 助手 (80256677)
|
研究期間 (年度) |
1994 – 1996
|
研究課題ステータス |
完了 (1996年度)
|
配分額 *注記 |
7,500千円 (直接経費: 7,500千円)
1996年度: 1,600千円 (直接経費: 1,600千円)
1995年度: 1,300千円 (直接経費: 1,300千円)
1994年度: 4,600千円 (直接経費: 4,600千円)
|
キーワード | 韻律的特徴 / 連続音声認識 / 基本周波数パターン / 重畳モデル / 統語境界 / モ-ラ遷移統計モデル / アクセント型 / ベイズ予測分類 / フレーズ成分 / 文節境界 / 韻律規則 / 部分Abs / フレーズ境界 / HMM / 韻津的特徴 / 時間構造 / 部分AbS法 |
研究概要 |
韻律的特徴を用いて単語の同定、統語境界の検出等を行う手法を開発し、これらを音声認識に利用することによって連続音声認識の性能向上を図ることを目的として、以下の成果(主なもの)をあげた。 1.朗読音声の韻律規則の修正・改良を行うとともに、対話音声の韻律的特徴についても朗読音声との比較分析を行って、韻律規則を構築した。話者の意図・態度・感情に関しても、韻律の特徴を明らかにした。 2.基本周波数パターンのその大局的特徴を利用して連続音声の統語境界を検出する手法を開発し、パターンの概形に関する知識を導入することによって検出精度の向上を達成した。 3.基本周波数パターンの低域フィルタリングによりアクセント成分を抑圧してフレーズ成分の立ち上がりを精度良く抽出する手法を提案した。重畳モデルに基づくAbSを組み合わせ、基本周波数パターンの特徴を自動抽出する手法を開発し、重要語等の検出を行った。 4.各認識候補に対し、対応する基本周波数パターンを上記1.の韻律規則から生成し、観測パターンとの比較によって確からしさを推定する手法を開発した。アクセント型の変化、統語境界の変化を伴う誤認識検出に有効であることを示した。 5.基本周波数パターンをモ-ラ単位でコード化した上で、HMM(モ-ラ遷移統計モデル)で表現する手法を提案し、文節境界、アクセント型の認識に有効なことを示した。 6.音素HMMの各状態での滞留の様子によって、1つの音素の学習データを複数のクラスタに分割し、それぞれについて、新しくHMMを作成する手法を提案し、認識率が向上することを示した。 7.未知の要因によって学習と認識の環境が異なる場合にも、認識率の低下が小さいベイズ予測分類法に基づく音声認識手法を提案した。雑音下での認識実験で、10%以上の大幅な認識率の向上が得られた。 以上の結果を、連続音声認識システムに組み込み、その結果を確認した。
|