• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

Word2Vecによる医学用語の分散表現は疾患間の数学的距離を定量的に表現するか

研究課題

研究課題/領域番号 19K16941
研究種目

若手研究

配分区分基金
審査区分 小区分52010:内科学一般関連
研究機関千葉大学

研究代表者

横川 大樹  千葉大学, 医学部附属病院, 特任助教 (80779869)

研究期間 (年度) 2019-04-01 – 2021-03-31
研究課題ステータス 完了 (2020年度)
配分額 *注記
1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2020年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2019年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
キーワード診療録 / 自然言語処理 / 分散表現 / 埋め込みベクトル / 疾患間距離 / 症状間距離 / Word2Vec / Doc2Vec / 臨床診断
研究開始時の研究の概要

病歴聴取は最も臨床診断に寄与する技術であるが人工知能・機械学習へは未だ置換されていない。疾患と疾患の類似度を定量的に評価する手法が無く、適切に学習やレコメンドできないことが一因である。病歴聴取を中心に診断困難例を診断している総合診療科のカルテ の自然言語に「Word2Vec や Doc2Vec」という単語の分散表現を適応することで、「疾患間距離」や「症状間距離」が計算できることが予想され、本研究はその実験研究である。今回得られる特徴量は日本語を解析させた情報であり、日本発の自動診断システム・診断推論補助システムの構築を推し進めることができ、悲劇的な見逃しや誤診を防ぐ未来につながると考える。

研究成果の概要

本研究では2013年から2019年に千葉大学医学部附属病院 総合診療科に受診した患者さんの診療録(電子カルテのテキストデータ)より、深層学習の技術の一つであるWord2Vecと Doc2Vecを用いて、単語や文章の分散表現を得ることができました。Word2Vecではのべ10578020語を用いて、単語と単語の近さや関係などを深層学習しました。その結果、「痛み」と「疼痛」、「咳嗽」と「咳」、「花粉症」と「アレルギー性鼻炎」などが似ている単語として示されました。またDoc2Vecによる診療録の埋め込みベクトルと診断名をペアにして深層学習し、診断名の予測を試みましたが、精度は50%に留まりました。

研究成果の学術的意義や社会的意義

疾患や症状がベクトルで数学的に表現でき、日本語の医学用語として正しい結果と解釈できる場合、疾患と疾患の類似度が表現でき、疾患同士の距離(近さや遠さ)と解釈することができます。医師は臨床診断をするときに疾患同士の距離をイメージしますが、これまでは医師の経験に大きく頼らざるを得ない状況でした。疾患同士の距離が私達が研究で得たベクトルにより定量的に数字で表現できるれば、病名の想起し忘れなどがないよう助けるシステムが構築できる可能性があります。医師も人間である以上、悲劇的な誤診を避けられず、誤診の削減は我々の大きな目標であり、今後は個人の努力だけでなくシステムとしてサポートできる可能性が期待できます。

報告書

(3件)
  • 2020 実績報告書   研究成果報告書 ( PDF )
  • 2019 実施状況報告書

URL: 

公開日: 2019-04-18   更新日: 2022-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi