研究課題/領域番号 |
20K07196
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分47060:医療薬学関連
|
研究機関 | 大阪大学 |
研究代表者 |
武田 理宏 大阪大学, 大学院医学系研究科, 教授 (70506493)
|
研究分担者 |
松村 泰志 独立行政法人国立病院機構大阪医療センター(臨床研究センター), その他部局等, 機関長・部門長クラス (90252642)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | リアルワールドデータ / 自然言語処理 / 機械学習 / 画像診断レポート / 二次利用 |
研究成果の概要 |
画像診断レポートから機械学習を用いた自然言語処理による情報抽出を行った。最初に固有表現抽出を用いて、「観察物」、「臨床所見」、「部位」、「変化」、「特徴」、「サイズ」の表現を抽出した。次に、抽出した固有表現の関係抽出を行った。最後に、文章の確信度を「確定」から「否定」まで5段階の尺度基準を分類した。 構築した情報抽出モデルを、大阪府下5施設の医療機関のデータウェアハウスに蓄積された画像診断レポートに適応し、JSON形式で出力を行った。 画像診断レポートの見落とし対策として、構築した情報抽出モデルを用いて、がんが含まれる画像診断レポートを抽出するプログラムを構築した。
|
自由記述の分野 |
医療情報学
|
研究成果の学術的意義や社会的意義 |
近年、リアルワールドデータ(RWD)の利活用が議論されるが、電子カルテデータで利活用の対象となるのは、レセプト・DPC情報、病名、処方、注射、検体検査結果などに限定されることが多い。 本研究は、フリーテキストで記載されるRWDを利活用するための取り組みの一つである。画像診断レポートから情報抽出することで、画像で診断される疾患を有する患者を正しく抽出することができる。また、画像で治療判定を行う疾患の、治療効果を検証することが可能となる。 我々は、がん所見が含まれるレポートを抽出することに成功した。これは、近年、社会問題となっている画像診断レポートの見落とし対策として、活用することが可能である。
|