研究課題/領域番号 |
16K00458
|
研究機関 | 千葉大学 |
研究代表者 |
鈴木 隆弘 千葉大学, 医学部附属病院, 准教授 (40323422)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 電子カルテ / 退院サマリー / テキストマイニング / 症例検索 / DPC |
研究実績の概要 |
本研究「多施設統合退院サマリーデータベースの臨床応用」は、連携研究者の所属する複数の病院から退院サマリーを収集し、千葉大学で開発したテキストマイニング技法を用いて解析することで、共通の文書ベクトル空間を持つ大型文書データベースを構築して、自動疾患判定や類似症例の検索を初めとした応用を試行すると共に精度の検証を行い、技術的および法律的な課題を整理・解決していく。 本研究は3カ年計画で実施する。広く診療情報を用いるためには各施設での倫理審査が必要であり、平成28年度は倫理審査で承認の得られた施設から訪問作業を行い、前回の研究以降に蓄積されたサマリーを収集して、既存のデータベースと統合したベクトル空間を構築する。データの収集と基本的な解析は各施設内で行い、千葉大学へは統計データのみを集約している。抽出したサマリーは索引語に分解して解析を行う。形態素解析には「MeCab(和布蕪)」を使用する。解析には約23万語の医学用語を抽出した辞書を準備しており、鈴木、髙﨑、嶋田が作成に協力したパラメディカル用医療辞書であるComeJishoも併用する。 千葉大学医学部附属病院では67266症例を抽出して64201後の索引語が得られた。同様に大阪大学医学部附属病院からは58726例で96320語、香川大学医学部附属病院からは20836例で55650語、高知大学医学部附属病院からは34994例で73621語、長崎医学部附属病院からは61582例で50198語、聖路加国際病院からは73064で39391語のデータがそれぞれ得られた。退院サマリーの総計は約32万例で、索引語としては約17万6千種が得られ、施設ごとにサマリーの特徴や単語出現頻度の分析、辞書による違いの検討などを行っている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
研究参加の各施設全てで、前回の研究時よりも個人情報の利用には慎重になっており、倫理審査に時間を要したために抽出作業の開始に遅れが出てしまった。また、改正個人情報保護法の施行を平成29年5月に控えていることから、情報利用範囲の拡大はガイドラインの内容を確認してからとなり、ガイドラインが未だ公開されていないために法律的な課題の検討に進めないでいる。島根大学は病院情報システムのリプレースが29年度早々に予定されているために抽出作業を行うことができなかった。作業開始は遅れたものの、28年度内に千葉大学医学部附属病院、大阪大学医学部附属病院、香川大学医学部附属病院、高知大学医学部附属病院、長崎医学部附属病院、聖路加国際病院の6施設からのデータ収集を行い、総計で約32万件のサマリーから延べ約4190万語の索引語が得られた。病院情報システムは退院サマリーの外部への一括出力機能を持たないことがあるが、本研究の参加校は前回の研究で環境を整えていたため、各施設の研究者自身で作業を行うことが出来た。
|
今後の研究の推進方策 |
平成29年度は、各施設でのサマリーの追加収集と新規参加の施設を募り、既存のデータと併せて解析を行う。並行して得られて単語情報を用いた辞書の整備を行う。類似症例検索などのアプリケーションは臨床での利用を通じて、操作性の改善点や検索結果の評価、検索に使われるキーワードや操作ログの収集によって評価と改良を行う。他院の退院サマリーを閲覧するには個人情報の確実な除去が必要である。原文から個人情報を除去して提供するために必要な要件の整理をおこない、病院の情報資産公開において問題が起きないためのプロトコルを検討する。 平成30年度は、研究の総括として研究成果を国内の医療情報関連学会にて報告する。また、国際医療情報学会、欧州医療情報学会などの国際学会においても発表を行う。
|
次年度使用額が生じた理由 |
平成28年度内にデータ抽出ができなかった施設があるため、そのための経費を29年度に繰り越した。 人員の確保ができなかった為人件費の使用がなく、今年度人員確保をする予定です。
|
次年度使用額の使用計画 |
研究参加施設を追加し、データ種集のために現地での処理を行う予定です。
|