研究概要 |
本研究ではまず,英単語発声中の強勢音節自動検出技術を,隠れマルコフモデルを用いて構築した。また,構築された強勢音節検出器を使って,学習者の発音上の癖の推定及び,その視覚化を実験的に検討した。ここでは,強勢・弱勢生成において優先的に用いられている音響的特徴量を強勢発音上の「癖」と定義した。この視覚化パターンが,各学習者が持つ英語発音能力とほぼ一致する様子についても実験的に検証した。 しかしながら上記の癖推定は,学習者に数十の異なる単語発声を要求していた。これは,癖推定及び視覚化処理が,強勢検出器を用いることで得られる強勢音節検出「率」を使って実現されていたことに因る。学習者へのフィードバックを考慮した場合,単語単発声のみを使用した癖推定と視覚化,及び,インタラクティブなフィードバックの実現が望まれる。そこで次に,上記の癖推定技術を改良することで,単語発声のみを用いた癖視覚化技術の構築を行なった。 ここでは,強勢検出率を扱うのではなく,正解強勢パターン(学習者が意図したパターン)の照合スコアと,競合パターンの最大スコアとの間の比(尤度比)に着眼した。そして,この尤度比を最大にするような特徴パラメータセット,即ち,正解強勢パターンと,最大尤度の競合パターン間の差異が最も明確化されるパラメータセットを癖として定義した。こうすることで,複数発声使用時と非常に類似した視覚化パターンを生成することができ,インタラクティブに表示される癖パターンと,数十単語発声後に描かれる癖パターンとに(表現上の)高い整合性を持たせることができた。 提案手法の評価は,複数発声により描かれる(単語発声群)に対する癖パターンと,個々の単語発声により画かれる癖パターンの「平均」パターンとの間に観測される相関(類似性)を見ることで行なった。その結果,日本人発声による英単語音声で相関値0.83,母語話者による英語発声で相関値0.72となった。単語単発声のみで推定していることを考慮すると,上記の結果は十分な精度が得られていると考えられる。 更には,上記の研究で構築された強勢音節・弱勢音節のHMMを文強勢検出に応用した。その結果,フレーズ成分の除去が,文強勢検出においては有効に寄与していることが示された。
|