日本のクラスサイズではスピーキング練習に時間を割けないことから,我々は仮想的にインタビューを行うVirtual Interviewing System (VIS)を開発してきた.しかし,英語コミュニケーションではジェスチャ等の非言語による情報伝達が45-60%を占める. 当該システムは,非言語を含めた英語コミュニケーション能力向上を考慮して,顔,音声,ジェスチャ認識で構成される.音声認識部では,既存の音声認識エンジンを用い,日本人のアクセントに対する精度向上を図った.顔認識では双子を判別することが可能になった.ジェスチャ認識では隠れマルコフモデルを利用し定型のジェスチャ認識を行った.
|