2022 Fiscal Year Annual Research Report
Development of standardization technique for clinical research data combining deep learning and semantic analysis
Project/Area Number |
17K15866
|
Research Institution | Hokkaido University |
Principal Investigator |
西本 尚樹 北海道大学, 大学病院, 特任准教授 (90599630)
|
Project Period (FY) |
2017-04-01 – 2023-03-31
|
Keywords | Deep learning / 自然言語処理 / データベース / 臨床研究 / 変数 / マッピング |
Outline of Annual Research Achievements |
2017年度の研究開始時には、深層学習の実装と課題の定式化についての知識を収集した。続いて、深層学習による結果の評価を行うために、ベイズ流の症例数設計方法を応用して、電子カルテの変数名を行うことができた。MEDINFO2017で発表した。研究計画当初に設定した3つの目標のうち、2018から2022年度まで(2)及び(3)の情報ソースの構築を進めた。 (1)Semantic integration技術:HL7/SS-MIX2データに対するメタデータの構築を行った (2)深層学習:変換パターンの分類とプログラミング言語による処理コーディングを行った (3)現状のマッピング割合24%から20%以上上乗せした変換割合向上を目指した 医学用語のコーティングに統計解析パッケージのSASを用いて、既存の臨床試験の変数mappingを行った。昨年度の研究から引き続いて、プログラミング言語Pythonを使用して、変数のmappingを行った。情報ソースは、統計解析パッケージSASに収録されている3,264人分のBMIと年齢のみが変数のサンプルデータ(BMIデータ)を用いた。サンプルデータは、米国national health and nutrition examination survey (NHANES)の8250人の男性のデータであり、さらにサンプリングが行われているものである。この変数名に対して、semantic integrationの技術を適用し、電子カルテデータの変数名や既存の試験のデータベース定義書から変数間のつながり、変換過程を記述する試みを行った。本研究で得られたPythonによるプログラミングの知識は、robotic process automationとして北海道大学病院データセンターにてデータマネージャの教育に利用した。
|