研究課題/領域番号 |
18500126
|
研究機関 | 山形大学 |
研究代表者 |
好田 正紀 山形大学, 大学院・理工学研究科, 教授 (00205337)
|
研究分担者 |
小坂 哲夫 山形大学, 大学院・理工学研究科, 准教授 (50359569)
加藤 正治 山形大学, 大学院・理工学研究科, 助手 (10250953)
|
キーワード | 日本語話し言葉コーパス / 音声認識 / 音響モデル / 言語モデル / 教師なし適応 / システム統合 |
研究概要 |
日本語話し言葉コーパス(CSJ)を用いて大語彙連続音声認識の音響モデル、言語モデル、デコーダ、モデル適応、システム統合の高性能化に関する検討を進めた。 1 音響モデルの高性能化 出力確率の分布形状として対角共分散モデルを拡張したブロック型全共分散モデル、モデル学習法として最尤推定法を拡張した識別学習、音素環境依存モデルとしてtriphoneモデルを拡張したquinphoneモデル、初期モデルとして認識対象話者に近い話者で作成した話者クラス音響モデルの利用、雑音/音楽環境下の音声認識のための音響モデル構成法、等の検討を行なった。 2 言語モデルの高性能化 単語N-gramと品詞N-gramの混合モデル、PLSA(確率的潜在意味解析)に基づく言語モデル、認識対象と話題の異なる議事録の利用、話題の類似したWebテキストの収集、等の検討を行なった。 3 デコーダの高性能化 混合モデルによる単語グラフのリスコア、等の検討を行なった。 4 モデル適応の高性能化 教師なし適応の繰り返し、適応データの選択や重み付け、PLSAに基づく単語N-gramや品詞N-gramの適応、ヒストグラム同等化を用いる話者適応、適応の種モデルとは異なるモデルで作成した適応データを用いるクロス適応、等の検討を行なった。 5 システム統合の高性能化 単語グラフの統合に基づくシステム統合、等の検討を行なった。
|