2022 Fiscal Year Final Research Report
A Study on Extracting Information from Diagnostic Imaging Reports Using Machine Learning and Its Utilization
Project/Area Number |
20K07196
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 47060:Clinical pharmacy-related
|
Research Institution | Osaka University |
Principal Investigator |
|
Co-Investigator(Kenkyū-buntansha) |
松村 泰志 独立行政法人国立病院機構大阪医療センター(臨床研究センター), その他部局等, 機関長・部門長クラス (90252642)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | リアルワールドデータ / 自然言語処理 / 機械学習 / 画像診断レポート / 二次利用 |
Outline of Final Research Achievements |
We extracted information from diagnostic imaging reports using natural language processing with machine learning. Firstly, First, named entity recognition was performed to extract "observation" "clinical finding," "anatomical location," "change," "characteristics," and "size" expressions. Next, the relation extraction between "observation" and the other extracted expressions was performed. Finally, we classified the confidence level of the sentences into five scale criteria, ranging from "definite" to "denial". Our information extraction model was adapted to diagnostic imaging reports stored in the data warehouses of five medical facilities in Osaka Prefecture and output in JSON format. To prevent diagnostic imaging reports from being overlooked, we built a program to extract diagnostic imaging reports that contain cancer using our information extraction model.
|
Free Research Field |
医療情報学
|
Academic Significance and Societal Importance of the Research Achievements |
近年、リアルワールドデータ(RWD)の利活用が議論されるが、電子カルテデータで利活用の対象となるのは、レセプト・DPC情報、病名、処方、注射、検体検査結果などに限定されることが多い。 本研究は、フリーテキストで記載されるRWDを利活用するための取り組みの一つである。画像診断レポートから情報抽出することで、画像で診断される疾患を有する患者を正しく抽出することができる。また、画像で治療判定を行う疾患の、治療効果を検証することが可能となる。 我々は、がん所見が含まれるレポートを抽出することに成功した。これは、近年、社会問題となっている画像診断レポートの見落とし対策として、活用することが可能である。
|