研究課題/領域番号 |
19K16941
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分52010:内科学一般関連
|
研究機関 | 千葉大学 |
研究代表者 |
横川 大樹 千葉大学, 医学部附属病院, 特任助教 (80779869)
|
研究期間 (年度) |
2019-04-01 – 2021-03-31
|
キーワード | 診療録 / 自然言語処理 / 分散表現 / 埋め込みベクトル / 疾患間距離 / 症状間距離 / Word2Vec / Doc2Vec |
研究成果の概要 |
本研究では2013年から2019年に千葉大学医学部附属病院 総合診療科に受診した患者さんの診療録(電子カルテのテキストデータ)より、深層学習の技術の一つであるWord2Vecと Doc2Vecを用いて、単語や文章の分散表現を得ることができました。Word2Vecではのべ10578020語を用いて、単語と単語の近さや関係などを深層学習しました。その結果、「痛み」と「疼痛」、「咳嗽」と「咳」、「花粉症」と「アレルギー性鼻炎」などが似ている単語として示されました。またDoc2Vecによる診療録の埋め込みベクトルと診断名をペアにして深層学習し、診断名の予測を試みましたが、精度は50%に留まりました。
|
自由記述の分野 |
自然言語処理、診断推論
|
研究成果の学術的意義や社会的意義 |
疾患や症状がベクトルで数学的に表現でき、日本語の医学用語として正しい結果と解釈できる場合、疾患と疾患の類似度が表現でき、疾患同士の距離(近さや遠さ)と解釈することができます。医師は臨床診断をするときに疾患同士の距離をイメージしますが、これまでは医師の経験に大きく頼らざるを得ない状況でした。疾患同士の距離が私達が研究で得たベクトルにより定量的に数字で表現できるれば、病名の想起し忘れなどがないよう助けるシステムが構築できる可能性があります。医師も人間である以上、悲劇的な誤診を避けられず、誤診の削減は我々の大きな目標であり、今後は個人の努力だけでなくシステムとしてサポートできる可能性が期待できます。
|