研究概要 |
本年度は、これまでの計2844件の評価データを開発したリスニング能力測定システムのデータベースに格納し,ベイズ統計を利用した合成音声評価スコアの提示アルゴリズムによる計算結果を推測値にするとともに,新しい合成音声を作成して実践的評価を行い,評価スコア提示アルゴリズムの有効性について検証した.これまでの評価データからより長い音節の単語または短母音/I/,/〓/と/〓/,長母音/i:/,/u:/と/з:r/及び二重母音/aI/,/〓I/を含む単語の合成音声は比較的高く評価される傾向が見られ,摩擦音においては,種類によって評価が分かれることが判明している.この結果を参考にして,提案アルゴリズムの実践的評価では,長母音/i:/,/u:/を含む単語や摩擦音がある単語を選んだ.被験者は37名の大学一年生である.サンプル音声は長母音を含む単語群と摩擦音中心の単語群に分かれる.被験者にはこれらの音声を聞き,その聞きやすさについて五段階評価(1-5)を行ってもらった.これらの実践的評価データを測定値として評価スコア提示アルゴリズムによる推測値と比較した.長母音を含む単語群のうち,5割の単語については,測定値と推測値の差が±0.2以内であり,8割強についてはその着が±0.9以内に収まっている.差の絶対値が1を超えたものはわずか2割弱である.摩擦音中心の単語群については,ほぼ同様な結果が得られている.従って,本研究で提案した評価スコア提示アルゴリズムは有効であると考えられる.一方,推測値と測定値の差が大きくなる理由について,更なる分析が必要である.理由の一つとして、一部の音素には評価データがなく,一律に1/5の確率を使用していることが挙げられる.また単語の親密度によって評価にもたらすバラツキも要素として取り入れる必要がある.
|