最終年度に実施した研究の成果は,言語学的な単位に応じた言い間違いの検出が可能になった点である.研究ではモーラと音韻単位の言い間違いを「音韻単位での言い間違い」,形態素や句,語単位の言い間違いを「語彙単位での言い間違い」と定義し,それぞれの言い間違いの検出に取り組んだ.言い間違いの検出には深層学習を用い,ニューラルネットワークにはCNNとLSTMを用いた.学習に利用できる言い間違いコーパスは3000程度と十分ではないため,2つの拡張手法を比較した.一つは音韻単位の言い間違いの規則を作成し,規則に一致した場合に言い間違いを作成する手法で,もう一つはランダムに変化させて言い間違いを作成する手法である.実験の結果,言い間違いの規則により拡張した場合にF値が68.5となった. 研究機関全体を通じて実施した研究の成果は,言い間違いや聞き間違いのコーパスを構築できたこと,聞き間違いの検出方法を確立したこと,言い間違いの検出を行ったことである.言い間違いは3000以上,聞き間違いは1100以上の量がある.聞き間違いの検出では入力文を音素列に変換し,言い間違い箇所を推定した.推定には音素の弁別素性表を利用した重み付きレーベンシュタイン距離を用いた.その結果助詞の有無を考慮しない場合87.3%の推定精度を得た.深層学習を用いた言い間違いの検出は十分な精度が得られなかったことからコーパスを拡張するよりも言語学的な単位ごとに規則を作成して精度向上を目指すほうがよいという知見が得られた. コミュニケーションの断絶の防止技術としては,ユーザがロボットの発話を聞き間違ったときの問い返しには高い精度で対応できる.ユーザが言い間違ったときの検出はできるものの精度が不十分である.
|