研究概要 |
音声認識を用いたリアルタイム字幕呈示システムにおいて,現状では精度100%の字幕の生成は困難であり,字幕は誤認識を含む不完全な文章になる.しかしながら,重要なのは最終的な伝達内容に対する理解を100%に近づけることであり,そのためには不完全部分を補うための情報を内容理解の阻害なしに最適な状態で呈示することが重要となる. そこで本課題では,現在までに行ってきた字幕生成過程における精度向上のみならず,字幕呈示過程においてもヒトが阻害なく情報補完・統合を行うために,誤認識を含む不完全文と発話時のノンバーバル情報を呈示させる際に,どの様な顔の部位や情報間の呈示タイミングなどと言った,情報呈示に関する最適な方法を探る研究を行う.
|