研究課題/領域番号 |
20K11833
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60080:データベース関連
|
研究機関 | 福井工業大学 |
研究代表者 |
芥子 育雄 福井工業大学, 工学部, 教授 (40815867)
|
研究分担者 |
中川 肇 富山大学, 学術研究部医学系, 教授 (30135256)
林 篤志 富山大学, 学術研究部医学系, 教授 (20283773)
辻岡 和孝 金城大学, 社会福祉学部, 講師 (50724960)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2020年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
|
キーワード | 意味表現学習 / 電子カルテ / 病名推定 / ICD10 / ニューラルネットワーク / 退院サマリ / 単語意味ベクトル辞書 / 病名シソーラス / 医工連携 / ディープラーニング |
研究開始時の研究の概要 |
ニューラルネットワークは学習結果の解釈性の課題がある.また,大規模データが必須であり,レアな病名が多い電子カルテの病名推定に応用することは困難である.研究代表者は,ニューラルネットワークの隠れノードを有限個で意味を代表する特徴単語で表現し,特徴単語との関連性を記述した単語意味ベクトル辞書を単語と隠れノード間の重み初期値に導入することにより,学習結果の解釈性を向上させた(意味表現学習と呼ぶ).本研究の目的は,病名推定を対象に特徴単語の新分野への対応,深層学習との融合による解釈性のある病名推定の性能向上,特徴単語空間での主訴分析のためのプラットフォーム化である.
|
研究実績の概要 |
ニューラルネットワークは学習結果の解釈が困難なことや大規模学習データが必要なため、症例が少ない病名が多い退院サマリの病名推定への応用には課題があった。病名推定とは標準病名マスタのICD10コードを退院サマリに自動付与することである。研究代表者は、ニューラルネットワークの隠れノードを有限個で意味を代表する特徴単語で表現し、単語意味ベクトル辞書を単語と隠れノード間の重みの初期値に導入することにより、学習データが十分に与えられなくても精度が高く学習結果の解釈性を向上させる意味表現学習を提案した。単語意味ベクトル辞書は264種類の特徴単語と2万語の基本単語との関連性を記述した汎用的な辞書である。本研究の目的は、病名推定を対象に(1)単語意味ベクトル辞書の医療分野への対応、(2)深層学習との融合による解釈性のある病名推定の性能向上、(3)特徴単語空間での主訴分析のためのプラットフォーム化である。令和4年度の実績は(1)~(3)に対応する以下の3点である。 1.特徴単語の選定条件を6文字未満の病名としたが、6文字以上の最上位概念3病名を追加し、病名T辞書末端の3病名を削除した。また病名T辞書の説明欄より症状を抽出した症状辞書より、出現頻度の高い35症状を特徴単語に追加した。内、7症状は264特徴単語と重複している。3病名、35症状の追加により、学習結果の解釈性は向上することを確認した。 2.深層学習BERTの事前学習モデルを用いた病名推定との精度比較を行った。医療文書で事前学習を行ったBERTを用いて旧電子カルテでファインチューニングを行った結果、10ポイント以上F値が向上することを確認した。 3.新電子カルテの上位20病名において重みが大きな8種類の特徴単語について、重みの降順で経過要約最大1000症例収集し、WordCloud、共起ネットワーク、サンバーストチャートによる分析を検証した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
1.最上位概念3病名を特徴単語に追加することにより、新電カル上位20病名に対する病名推定の解釈性(解釈性の定義:学習結果の分散表現の重みが最も大きな次元が推定病名の上位概念を表すこと)は70%から95%へと大幅に改善した。また、35症状の追加により、解釈性は90%に下がったが、分散表現の重み4位までの特徴単語が各推定病名の上位概念である割合は、46.2%から52.5%へ改善した。尚、病名推定のF値については、意味表現学習を5回試行し、最もF値が高い分散表現を解釈性の評価に用いた。 病名推定F値については、5回試行の平均で、従来の264種類の特徴単語:73.16、3病名追加:70.72、35症状追加(299特徴単語):72.12 となり、特徴単語の変更や追加は病名推定の解釈性は改善したが、病名推定F値自体は下がる結果となった。 2.東京大学大学院医学系研究科医療AI開発講座の日本語臨床テキストに特化した大規模言語モデルUTH-BERTと東北大学が日本語Wikipediaを元に構築した汎用大規模言語モデルTU-BERTを用いて評価を実施した。旧電カル11,839症例×60%訓練、20%検証(新電カルのトップ20病名に対応した症例)を用いて、両BERTをファインチューニングし、新電カル:11,930症例(トップ20病名)で評価を行った。UTH-BERT:精度82.6%、F値85.1、TU-BERT:精度64.7%、F値68となった。意味表現学習と医療辞書を融合した場合のF値は73.16である。 3.新電子カルテの上位20病名において重みの分布が大きな8種類の特徴単語(感覚器障害、循環器障害、など)を対象に重みの降順で経過要約を最大1000件(重みが閾値以上)を集め、分析を実施した。経過要約は先頭から500文字を対象としている。新旧電子カルテの特徴は分析できたが、目的の主訴分析ではない。
|
今後の研究の推進方策 |
今後の研究の推進方策を以下に記す。 1.現状、経過要約の先頭500文字を対象としていたが、様々な応用を考慮して、「主訴」と「診断病名コード」のペアを抽出し、新たなベンチマークを構築し、再評価を実施する。 2.GPT-4を用いた「主訴からの病名推定」の定量的な評価ができるように研究計画書に追記し、「人を対象とする研究倫理審査」を行う。 3.Microsoft Azure GPT-4のAPIを用いて病名推定のWebアプリケーションを試作した。病名、ICD10コード、根拠を指定した形式で返すことができるこを確認したが、正しいかどうかわからない課題がある。まずは、ベンチマークでの評価を実施する。 4.主訴からの病名推定の評価が良かったモデルを対象にWebアプリを構築し、大学病院での評価を目指す。
|