研究課題/領域番号 |
21K10303
|
研究機関 | 山口大学 |
研究代表者 |
石田 博 山口大学, 大学院医学系研究科, 教授 (50176195)
|
研究分担者 |
永野 浩昭 山口大学, 大学院医学系研究科, 教授 (10294050)
平野 靖 山口大学, 医学部附属病院, 准教授 (90324459)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 症例登録 / データの質 / 検証 / 構造化データ / 自然言語解析 |
研究実績の概要 |
消化器外科専門医領域での検討に引き続き、NCD乳腺専門医の手術症例に対する登録フォーム(CRF)上の項目内容における、DPC様式1、検査、処方等の構造化データの活用性の確認とともに、乳癌におけるNCD上の登録内容と電子カルテの情報との照合を行った。 乳癌に対する2020年度の手術登録症例108症例(両側乳癌3例を含む)の登録精度の検討では、NCD既登録情報と電子カルテ等の既存情報と照合した結果、登録症例の漏れは認めなかったが、消化器外科専門医領域と同様に数値型の入力である体重の差異、腫瘍径、浸潤径における明らかな数値差のある例がそれぞれ1~数例ずつ認められた。また、1割程度までのTN分類の差異を認め(M分類は差異なし)、ホルモンレセプター等のバイオマーカーに関する登録では術前情報での登録頻度が少なく、さらに、術後結果での登録においては結果のあるKi-67で未測定・未実施とした例が比較的多く認めた。これらのバイオマーカー情報については、術前・術後の病理報告にテキスト情報として含まれるものであり、NCD登録のタイミングにおける病理報告との時間的なずれ、あるいは、登録項目毎の異なる区分による選択肢の選択違いなどの要因が考えられた。 さらに乳腺を含む癌診療における病理検査の結果は基本的に必須登録項目であり、症例登録、および、検証時には病理所見の確認が必要であるが、形式がテキスト情報であり構造的情報としての取得が困難なことから、自然言語解析による固有表現抽出への取り組みを開始した。2022年度は、モデル構築に活用するため、2015年~2020年の乳癌手術症例(684症例)の病理および手術報告、さらに退院時サマリーのテキスト抽出を行うとともに、標準的な情報連携において活用されるREST APIを用いた情報取得のための基盤システムの開発を進めた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2022年度は、症例登録の対象種別を乳癌手術症例に拡大し、単年での登録内容と電子カルテ等の情報との比較によってその登録情報の精度の検討を行ったが、その中で構造化データであるSS-MIX2からの処方・注射情報からの抗がん剤等の登録情報抽出の汎用化を行った。特に乳癌手術症例の登録においては、浸潤径やバイオマーカー等の非構造化データである病理報告等のテキスト情報からの必要情報の取得が課題となり、自然言語解析による固有表現情報の抽出を行うための訓練データとして、病理報告等の情報収集を進めた。さらに、登録、および、参照対象となる情報収集の標準化に向けた基盤機能の開発を行うことができたため、概ね計画通りの進捗と判断した。
|
今後の研究の推進方策 |
乳癌手術症例の登録情報をもとに、電子カルテの二次利用基盤にある構造化情報の抽出機能の拡張についての検討を継続するとともに、非構造化情報からの自然言語解析を用いた固有情報の抽出基盤の検討を加えることで、登録支援・登録情報の検証に活用できる情報種別を拡大する。その上で、症例登録における情報検証システムのプロトタイプの開発を進める。
|
次年度使用額が生じた理由 |
次年度消耗品と合わせて使用する。
|