研究分担者 |
峯松 信明 東京大学, 大学院・工学系研究科, 助教授 (90273333)
山下 洋一 立命館大学, 理工学部, 助教授 (80174689)
新美 康永 京都工芸繊維大学, 工芸学部, 教授 (00026030)
高木 一幸 電気通信大学, 電気通信学部, 助手 (70272755)
吉田 利信 電気通信大学, 電気通信学部, 教授 (30114341)
|
研究概要 |
1.(1)ピッチ変化に起因するスペクトル包絡変動に関し,対象を有声子音及び無声子音に拡張して定量的分析を行った.その結果,有声子音のスペクトル包絡はピッチに依存して変動すること,無声子音にも補間ピッチに依存してスペクトルが変動するものがあること,などが明らかになった. (2)特殊拍の換算モーラ数算出法を考案した.また,局所話速に対する音素継続時間長の分布を求めた.その結果,分布は対象音素とその音素環境ごとに異なることが分かり,音素継続時間長の制御においては,局所話速とそれらの要因を共に考慮する必要のあることが明らかになった. 2.(1)韻律句境界情報に基づいて,大語彙連続音声認識の仮説探索におけるビーム幅,およびcross-word音響モデルの利用を制御する方式を提案し,認識実験によりその有効性を示した. (2)ポーズ,ピッチ,パワーなどに関連する多数の韻律的特徴量を取り上げ,係り受け解析におけるそれらの有効性を定量的に評価した.また,ポーズの継続時間長について,継続時間長が0のデータと正のデータを個別にモデル化することにより,係り受け解析の正解率が向上することを確認した. 3.連続音声中の韻律句のアクセント型を,隠れマルコフモデル(HMM)により認識する実験を行った.アクセント型は「0型」,「1型」,「N型(N【greater than or equal】2)」に分類した.音素HMMを用いて入力音声をモーラ単位に分割し,各モーラをさらにいくつかに等分したものをピッチパラメータ抽出の単位とした.クローズテストで約70%の認識率を得た. 4.テレビ論説番組の書き起こし文章に対し,被験者の判断により各文の重要度を定め,これと,音素長,パワー,ピッチなどの韻律的特徴量との相関を求めた.その結果,文単位では,パワーについてのみ明確な相関が見られるが,文中の最も特徴量の値が大きい単語を選んで相関を求めた場合は,すべての特徴量について明確な相関があることが明らかになった.
|