研究概要 |
本課題では,発話訓練機能を有する言語習得システムにて,ヘッドセットを不要とする環境での学習効率を向上させるシステムを実現することを最終目的としている。従来の音響技術では,一端末ごとに,多くの素子を利用する方法が現実的であったが,学習者が利用する個々の端末に用いるにはコストがかかる。また,各チャネル間の電気的系を一致させるために,校正も必要となり,現実的な方法とは言えない。そこで,特殊なハードウェアを増設せずに,各端末に標準的に利用されているオーディオ端子による音環境収集を行い,発話の評価精度を向上させることを目的としている。 最終年度は,学習端末に実時間で動作する発話評価システムを構築した。学習端末をネットワーク接続し,隣接妨害話者の音響信号を参照して雑音低減を行い,発話認識精度を向上させた。この学習端末を用いて各処理の所要時間を計測し,発話強調処理によって生じる遅延が150ms程度であり,孤立単語認識の所要時間を含めても発話から550ms程度の遅延で認識結果が得られた。また,発話強調性能の評価を実環境にて行い,妨害話者1人の場合に開発した雑音低減アルゴリズムを用いると33.6ポイント,妨害話者2人の場合に40.3ポイントの認識率向上し,発話訓練における効率的な学習を行える低価格で効果的な技術を開発できた。 ここで開発した技術は,発話訓練のみならず小型携帯機器を分散配置する議事録書き起こし技術などへの応用が期待できる。
|