本研究は、加齢に伴う難聴などに由来する軽度の聴覚障害者が、音声による対話を行う際に、文字情報を同時表示することにより、聞き返しを減らしてスムーズに対話を進めることを支援するシステムの作成を目的とする研究である。目的からして、システムは小型軽量が望ましく、当初カスタムLSIとマイクロディスプレイの組み合わせで構成することを意図したが、モバイル型の汎用パソコンが小型化されてきているので、マイク内蔵されたモバイルパソコン上でシステムを構築することとした。 18年度に行った音声認識は基本的には単語単位の認識を行っていたのでものであったが、そのため登録されていない単語は認識できない不便性をもつため、特定話者の音声に限定してはいるが、認識対象を任意の音節(かな)も認識できるシステムに拡大した。19年度では、音節の系列を音声指令で「かな漢字変換」する実験を行った。その結果、キーボード操作を介さないで任意の文章をモバイル型のディスプレイ装置に提示できるシステムを開発した。また、音節の誤認識が発生する問題に対処するため、音節認識結果の第2候補まで提示し、音声指令で第2候補の音節を採用できる方式を組み込むことにより、誤認識による煩わしさを軽減することができた。しかし、音節あたりの認識時間と誤認識率にはトレードオフの関係があり、誤認識を低く保ちながら認識時間を短縮できる技法を考案することが実用化に向けての課題である。 これらの成果の一部については、通信と情報技術に関する国際ワークショップ(ISCIT07)や電子情報通信学会の音声研究会で発表した。
|