放射線画像診断領域で実際に使用されている用語および文章を利用して認識エンジンにトレーニングを施し、放射線領域に適用可能な連続音声認識システムを構築した。放射線画像診断医がディクテーションに利用した際の認識率は、日常用語・政治経済用語用システムでは65%であったものが本システムにおいては90%に上昇し、一応の成果を見た。しかしながら90%という認識率は、誤認識部分の修正時間を考えるとまだ満足できる値ではない。キーボード入力の速度が40WPM程度である場合に、誤認識修正時間を含めた連続音声認識による入力時間をキーボード入力よりも短くするためには、およそ92%以上の認識率である必要があるとの推定が成されたからである。キーボード入力速度が遅い場合には現段階でも連続音声認識が短時間で済むが、それでもキーボード入力の数倍ないし数十倍の速さで入力が完了しないのであれば、連続音声入力システムを導入するメリットは少ないと現場では考えるであろう。すなわち、よりいっそうの認識率向上か、もしくは誤認識の修正を短時間で行うことのできるような工夫が必要とされ、これらが今後の課題となる。そのためには、さらに多くの放射線領域の文章をトレーニングさせるのか、もしくはディクテーション技術の人間側の工夫(例えば限定した用語を使う、認識率の高い話し方を心がける、など)のアプローチが考えられる。 なお、当初の研究計画では連続音声認識エンジンをサーバーで稼動させ、クライアント・サーバーによる運用を考えていたが、実際にはネットワークを介する情報のやり取りによるオーバーヘッドが大きく、各クライアントにシステムをインストールして運用した方が現実的であることが明らかになった。
|