研究課題/領域番号 |
20K07196
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分47060:医療薬学関連
|
研究機関 | 大阪大学 |
研究代表者 |
武田 理宏 大阪大学, 大学院医学系研究科, 教授 (70506493)
|
研究分担者 |
松村 泰志 独立行政法人国立病院機構大阪医療センター(臨床研究センター), その他部局等, 機関長・部門長クラス (90252642)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2021年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | リアルワールドデータ / 自然言語処理 / 機械学習 / 画像診断レポート / 二次利用 / 臨床応用 |
研究開始時の研究の概要 |
近年、多施設の電子カルテデータベースに蓄積された臨床データの利活用が取り組まれている。データの利活用は構造化、標準化されたデータが対象となるため、その範囲はレセプト・DPC、処方・注射オーダ、検体検査結果などに限定される。本研究では、電子カルテで自然言語で記述される記録から、機械学習により情報抽出を試みる。その対象は、情報がまとまって記述される画像診断レポートとする。本研究はリアルワールドデータの利活用を進めることで医学研究の発展に寄与できる。また、重要所見が記載される画像診断レポートを判別することで、近年問題となっている画像レポート見落とし防止問題の解決にみ寄与できる可能性がある。
|
研究成果の概要 |
画像診断レポートから機械学習を用いた自然言語処理による情報抽出を行った。最初に固有表現抽出を用いて、「観察物」、「臨床所見」、「部位」、「変化」、「特徴」、「サイズ」の表現を抽出した。次に、抽出した固有表現の関係抽出を行った。最後に、文章の確信度を「確定」から「否定」まで5段階の尺度基準を分類した。 構築した情報抽出モデルを、大阪府下5施設の医療機関のデータウェアハウスに蓄積された画像診断レポートに適応し、JSON形式で出力を行った。 画像診断レポートの見落とし対策として、構築した情報抽出モデルを用いて、がんが含まれる画像診断レポートを抽出するプログラムを構築した。
|
研究成果の学術的意義や社会的意義 |
近年、リアルワールドデータ(RWD)の利活用が議論されるが、電子カルテデータで利活用の対象となるのは、レセプト・DPC情報、病名、処方、注射、検体検査結果などに限定されることが多い。 本研究は、フリーテキストで記載されるRWDを利活用するための取り組みの一つである。画像診断レポートから情報抽出することで、画像で診断される疾患を有する患者を正しく抽出することができる。また、画像で治療判定を行う疾患の、治療効果を検証することが可能となる。 我々は、がん所見が含まれるレポートを抽出することに成功した。これは、近年、社会問題となっている画像診断レポートの見落とし対策として、活用することが可能である。
|