• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2000 Fiscal Year Annual Research Report

発声上の癖の推定に基づく英語音声の発音評価・教示手法の開発

Research Project

Project/Area Number 11780265
Research InstitutionThe University of Tokyo

Principal Investigator

峯松 信明  東京大学, 大学院・工学系研究科, 助教授 (90273333)

Keywords単語強勢 / 音声認識 / 発声上の癖 / 韻律的特徴 / 文強勢 / フレーズ成分
Research Abstract

本研究ではまず,英単語発声中の強勢音節自動検出技術を,隠れマルコフモデルを用いて構築した。また,構築された強勢音節検出器を使って,学習者の発音上の癖の推定及び,その視覚化を実験的に検討した。ここでは,強勢・弱勢生成において優先的に用いられている音響的特徴量を強勢発音上の「癖」と定義した。この視覚化パターンが,各学習者が持つ英語発音能力とほぼ一致する様子についても実験的に検証した。
しかしながら上記の癖推定は,学習者に数十の異なる単語発声を要求していた。これは,癖推定及び視覚化処理が,強勢検出器を用いることで得られる強勢音節検出「率」を使って実現されていたことに因る。学習者へのフィードバックを考慮した場合,単語単発声のみを使用した癖推定と視覚化,及び,インタラクティブなフィードバックの実現が望まれる。そこで次に,上記の癖推定技術を改良することで,単語発声のみを用いた癖視覚化技術の構築を行なった。
ここでは,強勢検出率を扱うのではなく,正解強勢パターン(学習者が意図したパターン)の照合スコアと,競合パターンの最大スコアとの間の比(尤度比)に着眼した。そして,この尤度比を最大にするような特徴パラメータセット,即ち,正解強勢パターンと,最大尤度の競合パターン間の差異が最も明確化されるパラメータセットを癖として定義した。こうすることで,複数発声使用時と非常に類似した視覚化パターンを生成することができ,インタラクティブに表示される癖パターンと,数十単語発声後に描かれる癖パターンとに(表現上の)高い整合性を持たせることができた。
提案手法の評価は,複数発声により描かれる(単語発声群)に対する癖パターンと,個々の単語発声により画かれる癖パターンの「平均」パターンとの間に観測される相関(類似性)を見ることで行なった。その結果,日本人発声による英単語音声で相関値0.83,母語話者による英語発声で相関値0.72となった。単語単発声のみで推定していることを考慮すると,上記の結果は十分な精度が得られていると考えられる。
更には,上記の研究で構築された強勢音節・弱勢音節のHMMを文強勢検出に応用した。その結果,フレーズ成分の除去が,文強勢検出においては有効に寄与していることが示された。

  • Research Products

    (6 results)

All Other

All Publications (6 results)

  • [Publications] 峯松信明,中川聖一: "PSOLA分析合成に基づくFO変換音声の品質向上に関する実験的検討"電子情報通信学会論文誌. J83-DII,7. 1590-1599 (2000)

  • [Publications] N.Minematsu and S.Nakagawa: "Instantaneous estimation of prosodic pronunciation habits for interactive instructions to Japanese learning English"Proc.ICSLP2000. Vol.3. 191-194 (2000)

  • [Publications] N.Minematsu and S.Nakagawa: "Performance comparison among HMM,DTW and human abilities in terms of identifying stress patterns of word utterances"Proc.ICSLP2000. Vol.1. 617-620 (2000)

  • [Publications] N.Minematsu and S.Nakagawa: "Visualization of pronunciation habits using speech recognition techniques"Proc.WESTPRAC2000. Vol.1. 141-144 (2000)

  • [Publications] N.Minematsu and S.Nakagawa: "Visualization of pronunciation habits based upon abstract representation of acoustic observations"Proc.INSTIL2000. Vol.1. 130-137 (2000)

  • [Publications] 峯松信明,小橋川哲,広瀬啓吉: "語学学習支援を目的とした英語音声からのリズム同定に関する実験的検討"日本音響学会春季講演論文集. 3-6-6. 331-332 (2001)

URL: 

Published: 2002-04-03   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi