1999 Fiscal Year Annual Research Report
連続音声認識を利用した放射線画像診断の報告書の作成
Project/Area Number |
11670872
|
Research Institution | The University of Tokyo |
Principal Investigator |
小野木 雄三 東京大学, 医学部・附属病院, 講師 (90233593)
|
Keywords | 連続音声認識 / 放射線検査 / 読影報告書 / ディクテーション |
Research Abstract |
過去5年間にわたり当院にて蓄積された放射線検査読影報告書の所見内容と,報告書を作成する際の雛型として登録された文章を(レポートとして86458件,74万語),テキストファイルとしてデータベースから取り出した。連続音声認識エンジンには,すでに日本語の音声モデルが含まれているため,放射線および医学用語を大量に含んだかな漢字混じり文字列,すなわち上記のテキストをコーパスとして供給し,音声認識エンジンのトレーニング操作を行った。こうして生成された音声認識エンジンの性能を,実際の放射線検査の読影に試用し,認識率の計測や問題点の検索を行った。 この音声認識エンジンの性能を評価したとごろ,90%程度の認識率が得られた。今回作成した医学辞書が存在しない場合の認識率は65%であり,辞書作成の効果は明らかであった。また,音声入力の認識速度は通常に使用した場合で120word/minに達し,より早口で話した場合でも正しく認識された。認識率低下の原因として,周囲の雑音など音源の影響が大きかった。指向性の高いマイクを使用しているにもかかわらず,マイクの位置や発声の違いで認識精度が大きく変化するため,人間の側である程度練習を積み,機械の操作に慣れる必要があった。予想していなかった問題点として,単にフィルムを見ながら所見をロ述する通常のディクテーシヨンとは異なり,機械が認識しやすいようによどみなく喋る必要があること,また正しく認識されたか否かを頻回に確認しなくてはいけないために,よどみなく喋ることが難しい,ということが明らかになった。誤認識された部分の修正に,通常のキーボードを使用すると,意外に時間を要するため,認識率95%程度以上でない限り,最初からキーボードで入力した方が総合的な入力時間が短くなることがわかった。今後は誤認識を効率よく短時間で修正できる方法を開発する必要がある。
|
Research Products
(1 results)