研究課題/領域番号 |
19K16941
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分52010:内科学一般関連
|
研究機関 | 千葉大学 |
研究代表者 |
横川 大樹 千葉大学, 医学部附属病院, 特任助教 (80779869)
|
研究期間 (年度) |
2019-04-01 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2020年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2019年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
|
キーワード | 診療録 / 自然言語処理 / 分散表現 / 埋め込みベクトル / 疾患間距離 / 症状間距離 / Word2Vec / Doc2Vec / 臨床診断 |
研究開始時の研究の概要 |
病歴聴取は最も臨床診断に寄与する技術であるが人工知能・機械学習へは未だ置換されていない。疾患と疾患の類似度を定量的に評価する手法が無く、適切に学習やレコメンドできないことが一因である。病歴聴取を中心に診断困難例を診断している総合診療科のカルテ の自然言語に「Word2Vec や Doc2Vec」という単語の分散表現を適応することで、「疾患間距離」や「症状間距離」が計算できることが予想され、本研究はその実験研究である。今回得られる特徴量は日本語を解析させた情報であり、日本発の自動診断システム・診断推論補助システムの構築を推し進めることができ、悲劇的な見逃しや誤診を防ぐ未来につながると考える。
|
研究成果の概要 |
本研究では2013年から2019年に千葉大学医学部附属病院 総合診療科に受診した患者さんの診療録(電子カルテのテキストデータ)より、深層学習の技術の一つであるWord2Vecと Doc2Vecを用いて、単語や文章の分散表現を得ることができました。Word2Vecではのべ10578020語を用いて、単語と単語の近さや関係などを深層学習しました。その結果、「痛み」と「疼痛」、「咳嗽」と「咳」、「花粉症」と「アレルギー性鼻炎」などが似ている単語として示されました。またDoc2Vecによる診療録の埋め込みベクトルと診断名をペアにして深層学習し、診断名の予測を試みましたが、精度は50%に留まりました。
|
研究成果の学術的意義や社会的意義 |
疾患や症状がベクトルで数学的に表現でき、日本語の医学用語として正しい結果と解釈できる場合、疾患と疾患の類似度が表現でき、疾患同士の距離(近さや遠さ)と解釈することができます。医師は臨床診断をするときに疾患同士の距離をイメージしますが、これまでは医師の経験に大きく頼らざるを得ない状況でした。疾患同士の距離が私達が研究で得たベクトルにより定量的に数字で表現できるれば、病名の想起し忘れなどがないよう助けるシステムが構築できる可能性があります。医師も人間である以上、悲劇的な誤診を避けられず、誤診の削減は我々の大きな目標であり、今後は個人の努力だけでなくシステムとしてサポートできる可能性が期待できます。
|