2015 年度研究成果報告書

語彙レベル韻律情報の高精度予測に基づく大語彙連続音声認識の高精度化

研究課題

研究課題/領域番号	25540064
研究種目	挑戦的萌芽研究
配分区分	基金
研究分野	知覚情報処理
研究機関	東京大学
研究代表者	峯松信明東京大学, 工学(系)研究科(研究院), 教授 (90273333)
研究期間 (年度)	2013-04-01 – 2016-03-31
キーワード	音声認識 / 韻律的特徴 / アクセント句境界 / アクセント核位置 / リランキング / Average perceptron / CRF / 構造的表象
研究成果の概要	日本語は語彙レベルの韻律情報（単語アクセント）が，孤立発声時と文音声発声時とでは異なる。複数出力される音声認識仮説の妥当性を再評価するリランキング処理において，予測される（変形後の）語彙レベル韻律と，実際に観測された韻律とを比較することで，精度向上が期待できる。種々の検討の結果，任意テキスト（認識仮説）に対して語彙韻律を予測するモジュール，及び，リランキング処理の実装は完了したが，観測された韻律に対して正しくアクセント核位置を検出する処理系の実装が極めて困難であることがわかった。最終的には準韻律的特徴と解釈できる音声の構造的表象に基づくリランキングを実装し，音声認識精度向上を実現した。
自由記述の分野	音声科学・音声工学