2022 Fiscal Year Final Research Report
Can Distributed Representations of Disease Learned from Academic Journal Abstracts Represent the Distance Between Diseases?
Project/Area Number |
21K17848
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 62010:Life, health and medical informatics-related
|
Research Institution | Chiba University |
Principal Investigator |
Yokokawa Daiki 千葉大学, 医学部附属病院, 特任助教 (80779869)
|
Project Period (FY) |
2021-04-01 – 2023-03-31
|
Keywords | 診断推論 / 自然言語処理 / Word2Vec / 分散表現 / 埋め込みベクトル / 疾患間距離 / 抄録 / 医中誌 |
Outline of Final Research Achievements |
Presently, no systems can be applied in actual medical settings to aid or replace the acquisition of diagnostic reasoning methods. I hypothesized that calculating disease similarity (inter-disease distance) could be instrumental in creating such systems. By training on 1,842,156 abstracts from the Central Medical Journal with Word2Vec, I procured distributed representations (disease vectors) of words denoting diseases and successfully calculated their distance. I found 8,031 disease vectors corresponding to the International Classification of Diseases, 10th Edition (ICD-10), which match 3,915 ICD codes. Cohen's correlation coefficient reached a maximum value of 0.7748. Adjusted Rand index, standardization, normalized mutual information, and adjusted mutual information for ICD codes achieved maximum values of 0.3208, 0.8783, and 0.4242, respectively.
|
Free Research Field |
自然言語処理
|
Academic Significance and Societal Importance of the Research Achievements |
疾患間距離を医学文書から計算することで、主観的な経験則に基づく疾患想起から、客観的な距離に基づく疾患想起への転換が可能になる。医師の経験は収斂され分散表現へと置き換わり、普遍的で汎用性が高い距離データを得られる。これは診断推論の「疾患想起のプロセス」をAIに置き換え、自動診断システムや診断支援システムの開発への第一歩となる。これらのシステムは、自宅で病院へ行くべきか判断する際のサポートツールとなり、医療費削減や医療の質の均質化に貢献し、悲劇的な誤診や見逃しを削減する可能性がある。日本語に基づいたAI診断支援システムを作成するためには、日本独自の研究が必要で、本研究はその基盤となる。
|