1996 Fiscal Year Annual Research Report
A^*探索による自由発話音声の認識アルゴリズム高度化の研究
Project/Area Number |
07680379
|
Research Institution | Yamagata University |
Principal Investigator |
好田 正紀 山形大学, 工学部, 教授 (00205337)
|
Co-Investigator(Kenkyū-buntansha) |
加藤 正治 山形大学, 工学部, 助手 (10250953)
|
Keywords | 音声認識 / 音響モデル / 音素決定木 / HMM / HM-Net / N-gram / 言語モデル / 尤度正規化 |
Research Abstract |
自由発話音声の認識処理を、音響モデル・語彙・言語モデル等を統合したグラフ上の探索問題として定式化し、認識アルゴリズムの要素技術である音響モデル、単語マッチング、言語モデルの高度化に重点をおいて研究を進めた. 1.音響モデルの精密化と話者適応 音素環境依存の音響モデルHM-Netを、音素決定木に基づく逐次状態分割法で自動生成する手法DT-SSSを提案し、時間方向の状態分割や適切な初期モデルが、生成されるHM-Netの性能改善に有効であることを確認した.また、MAP推定法によるHM-Netの話者適応の有効性を検討した. 2.単語マッチングの尤度正規化 連続音声中の単語区間の尤度を正規化するために、音節連接HMMの上位N個の平均スコアに基づく正規化法を提案し、連続音声認識におけるワードスポッティングや高速マッチングに適用して有効であることを確認した. 3.言語モデルの構築とタスク適応 大語彙言語データからのN-gram言語モデルの構築と並行して、HMMに基づく言語モデル、確率文脈自由文法に基づく言語モデルの構築を進めた.また、既存の大量の言語データに特定タスクの言語データを少量混合することによって、N-gram言語モデルのタスク適応が有効であることを確認した.
|
Research Products
(6 results)
-
[Publications] 伊藤彰則: "かな・漢字文字列の連鎖統計による言語モデル" 電子情報通信学会論文誌. 79-D-II,12. 2062-2069 (1996)
-
[Publications] 伊藤彰則: "Language modelling by string pattern N-gram for Japanese speech recognition" 音声言語処理に関する国際会議(ICSLP). Vol.1. 490-493 (1996)
-
[Publications] 伊藤彰則: "対話音声認識のための事前タスク適応の検討" 電子情報通信学会技術研究報告. SP96-81. 25-32 (1996)
-
[Publications] 堀貴明: "音素決定木に基づく逐次状態分割法によるHMnetの性能改善" 電子情報通信学会技術研究報告. SP96-80. 17-24 (1996)
-
[Publications] 加藤正治: "最適音素系列に基づく単語予備選択法の検討" 電子情報通信学会技術研究報告. SP96-13. 9-14 (1996)
-
[Publications] 伊藤彰則: "大語彙言語データベースからのN-gram構築とタスク適応の検討" 情報処理学会音声言語情報処理研究会. SLP-11-5. 25-30 (1996)