1997 Fiscal Year Annual Research Report
Project/Area Number |
07680401
|
Research Institution | The University of Tokushima |
Principal Investigator |
北 研二 徳島大学, 工学部, 助教授 (10243734)
|
Keywords | 音声認識 / 双方向探索 / 隠れマルコフモデル / One-Passアルゴリズム / 音響モデル / 言語モデル / 有限オートマトン / 確率文脈自由文法 |
Research Abstract |
Forward-Backward探索アルゴリズムに基づく双方向探索型の音声認識プログラムを用いて、さまざまな探索条件のもとでの評価実験を行った。認識実験では、評価音声データとしATR自動翻訳電話研究所発行の研究用日本語音声データベースに収録されている音声データを用いた。この音声データをサンプリング周波数12kHz、窓長21.3ms、周期9msのハミング窓をかけた後、12次のLPC分析を行い、スペクトル(WLR)、ケストラム係数の差分(差分CEP)、PWLR距離尺度中のパワー項(POW)の3種類の特徴量を抽出した。また、HMMは離散型出力確率分布を持つ音韻モデルを用い、継続時間長制御なし、子音3状態、母音1状態とした。 認識実験においては、まず後向き方向に認識を行い各フレーム毎に有限オートマトンの状態番号と、その状態番号における尤度を保存し、保存した情報を用いて前向き方向に有限オートマトン制約あるいは文脈自由文法制約による探索を行った。文脈自由文法制約による探索では、文脈自由文法をLR構文解析表に展開し、LR構文解析表の状態番号と有限オートマトンの状態の対応付けを行うことにより、認識仮説の接続可能性チェックを行った。 各種探索条件による認識率を下に示す。下記の実験結果より、双方向型探索を用いることにより、認識率の向上をはかることができた。 (a)前向き探索のみで有限オートマトン制約を使った場合:87.3% (b)後向き探索のみで有限オートマトン制約を使った場合:77.1% (c)前向き・後向き探索ともに有限オートマトン制約を使った場合:87.5% (d)前向き探索に文脈自由文法を後向き探索に有限オートマトン制約を使った場合:88.6%
|
-
[Publications] Kenji Kita et al.: "Collocations in Language Learuing : Corpus-Based Automatic Compilation of Collocations and Bilingual Collocation Concordancer" Computer Assisted Language Learning. 10・3. 229-238 (1997)
-
[Publications] 北 研二: "確率的言語モデルに基づく多言語コーパスからの言語系統樹の再構築" 自然言語処理. 4・3. 71-82 (1997)
-
[Publications] 北 研二 他: "発話タイプ付きコーパスを用いた確率的対話モデルの自動生成" 自然言語処理. 4・4. 73-85 (1997)
-
[Publications] Kenji Kita et al.: "A Probabilistic-model-based Language Clustering Approach : To Reconstruct Language System Tree from the Multilingual Corpus" Proceedings of JSCL-97. 109-114 (1997)
-
[Publications] Paliwal K.K., 北 研二 他: "自由発話音声認識における音響分析の比較" 日本音響学会講演論文集. 5-6 (1997)
-
[Publications] 小田 裕樹, 北 研二: "単語の位置情報に基づくコーパスからのコロケーションの自動抽出" 自然言語処理. 5・1. 79-99 (1998)