研究課題/領域番号 |
12680375
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 北陸先端科学技術大学院大学 |
研究代表者 |
下平 博 北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (30206239)
|
研究分担者 |
中井 満 北陸先端科学技術大学院大学, 情報科学研究科, 助手 (60283149)
嵯峨山 茂樹 東京大学, 大学院・情報理工学系研究科, 教授 (00303321)
|
研究期間 (年度) |
2000 – 2002
|
研究課題ステータス |
完了 (2002年度)
|
配分額 *注記 |
3,400千円 (直接経費: 3,400千円)
2002年度: 800千円 (直接経費: 800千円)
2001年度: 900千円 (直接経費: 900千円)
2000年度: 1,700千円 (直接経費: 1,700千円)
|
キーワード | 隠れマルコフモデル / HMM / 非同期遷移 / AT-HMM / 非同期遷移型HMM / 時間方向共有 / 特定話者音声認識 / 複数軌道モデル / 特徴量別音素環境依存モデル / 特徴量依存音素環境クラスタリング |
研究概要 |
従来の隠れマルコフモデルHMMによる音声信号のモデル化は、音響特徴量(20次元程度のベクトル)の各成分の時間変化のタイミング、すなわち状態遷移が互いに同期していることを暗黙のうちに仮定していた。同期という拘束条件を取り払い、モデルの自由度を上げることによって、音響特徴量の実際の時間変化をより高精度に、かつ効果的に表現できる非同期遷移HMM(AT-HMM)について検討を行った。 その結果、一般のAT-HMMを用いたデコーディング(認識処理)には2段DPあるいはLevel-Building法が基本的には必要であり、通常の同期型HMMに比べて計算量が膨大であることを明らかにした。この問題に対して、非同期構造にある種の順序制約を付加した順序制約付きAT-HMMを考案し、このクラスのAT-HMMは従来の同期型HMMと同様の高速デコーディング法(例えばOne-Pass Viterbi探索法)が利用できることを示した。この、順序制約付きAT-HMMは、「時間方向共有」と呼ばれる新しい共有化法の概念を導入することにより、実現が可能であり、クラスタリングを用いた順序制約付きAT-HMMの学習アルゴリズムを新たに提案した。提案手法は特定話者の連続音素認識において従来方を上回る認識性能が得られた。一方、不特定話者認識における効果は少ないことが確認され、分析の結果、話者によって非同期構造が異なることが分かった。 また、AT-HMMを利用して、特徴量毎に音素環境依存性が異なることを許した新しいモデル学習法として特徴量依存音素環境クラスタリング法を開発した。特定話者による実験の結果、学習データに関しては従来法より高い認識率が得られ、有効性が確認された。
|