研究概要 |
今年度は,まず日本人話者のための英語韻律評価システムの開発を行った.韻律としてはイントネーションとリズムの2つを対象とした.リズム評価については,特徴量として単語の持続時間比と,学習者発話と教師発話の対数パワーのDP距離を組み合わせて用い,英語母語話者評定値との相関係数0.55を得た.これは英語母語話者評定値間の相関に近い値であるので,システムが人間による評価に迫る精度を得たことがわかる.次に,イントネーションに関しては決定木を用いた単語重み付け手法を開発した.特徴量としてFO,ΔFO,パワー,Δパワーを用い,教師話者との近さとして重みつきユークリッド距離を用いた.この距離を単語ごとに積算して発話全体のイントネーション評価値を計算するが,教師話者との相違が全体のイントネーションの良し悪しに与える影響は単語ごとに異なるため,この影響を重回帰分析によって求めた.単語ごとの距離を偏回帰係数で重み付けて積算した評価値が母語話者の評定値に近づくように偏回帰係数を計算した.その結果,母語話者評定値との相関係数が0.45となった. 次に,対話型CALLシステムのための非母語話者発話認識法を開発した.昨年度は認識に有限状態文法を使ったが十分な精度が得られなかったことから,今年度はn-gramを利用した.n-gramの学習にはデータが必要なので,その場面での正解となる文から誤りルールを用いてユーザ発話を予測し,その予測文からn-gramを学習する方法を開発した.これにより,有限状態文法と誤りルールを用いた場合を超える性能を達成し,誤りを人手でチューニングした有限状態文法による認識とほぼ同じ認識性能を得た.次に,誤り訂正モデルによる認識性能の向上を検討した.正解文との距離によって誤認識を訂正する方法と,品詞n-gram素性を用いた誤り訂正モデルの2つを試した.その結果,単語正解率の点では正解文との距離による方法が高く,学習者の発話誤りの指摘精度ではn-gram素性による誤り訂正モデルのほうが高性能であった.
|