2000 年度実績報告書

連続音声認識を利用した放射線画像診断報告書の作成

研究課題

研究課題/領域番号	11670872
研究機関	東京大学
研究代表者	小野木雄三東京大学, 医学部・附属病院, 講師 (90233593)
キーワード	連続音声認識 / 放射線診断報告書 / ディクテーション / 認識率
研究概要	放射線画像診断領域で実際に使用されている用語および文章を利用して認識エンジンにトレーニングを施し、放射線領域に適用可能な連続音声認識システムを構築した。放射線画像診断医がディクテーションに利用した際の認識率は、日常用語・政治経済用語用システムでは65%であったものが本システムにおいては90%に上昇し、一応の成果を見た。しかしながら90%という認識率は、誤認識部分の修正時間を考えるとまだ満足できる値ではない。キーボード入力の速度が40WPM程度である場合に、誤認識修正時間を含めた連続音声認識による入力時間をキーボード入力よりも短くするためには、およそ92%以上の認識率である必要があるとの推定が成されたからである。キーボード入力速度が遅い場合には現段階でも連続音声認識が短時間で済むが、それでもキーボード入力の数倍ないし数十倍の速さで入力が完了しないのであれば、連続音声入力システムを導入するメリットは少ないと現場では考えるであろう。すなわち、よりいっそうの認識率向上か、もしくは誤認識の修正を短時間で行うことのできるような工夫が必要とされ、これらが今後の課題となる。そのためには、さらに多くの放射線領域の文章をトレーニングさせるのか、もしくはディクテーション技術の人間側の工夫(例えば限定した用語を使う、認識率の高い話し方を心がける、など)のアプローチが考えられる。なお、当初の研究計画では連続音声認識エンジンをサーバーで稼動させ、クライアント・サーバーによる運用を考えていたが、実際にはネットワークを介する情報のやり取りによるオーバーヘッドが大きく、各クライアントにシステムをインストールして運用した方が現実的であることが明らかになった。

研究成果
(3件)

すべてその他

すべて文献書誌 (3件)

[文献書誌] 小野木雄三: "連続音声認識を利用した放射線読影報告書"第19回医療情報学連合大会論文集. 702-3 (1999)
[文献書誌] 小野木雄三: "連続音声認識を利用したレポートシステム"新医療. 28・4. (2001)
[文献書誌] 小野木雄三: "連続音声認識を利用した放射線画像診断報告書の作成"インナービジョン. 16・6. (2001)