研究実績の概要 |
2017年度の研究開始時には、深層学習の実装と課題の定式化についての知識を収集した。続いて、深層学習による結果の評価を行うために、ベイズ流の症例数設計方法を応用して、電子カルテの変数名を行うことができた。MEDINFO2017で発表した。研究計画当初に設定した3つの目標のうち、2018から2022年度まで(2)及び(3)の情報ソースの構築を進めた。 (1)Semantic integration技術:HL7/SS-MIX2データに対するメタデータの構築を行った (2)深層学習:変換パターンの分類とプログラミング言語による処理コーディングを行った (3)現状のマッピング割合24%から20%以上上乗せした変換割合向上を目指した 医学用語のコーティングに統計解析パッケージのSASを用いて、既存の臨床試験の変数mappingを行った。昨年度の研究から引き続いて、プログラミング言語Pythonを使用して、変数のmappingを行った。情報ソースは、統計解析パッケージSASに収録されている3,264人分のBMIと年齢のみが変数のサンプルデータ(BMIデータ)を用いた。サンプルデータは、米国national health and nutrition examination survey (NHANES)の8250人の男性のデータであり、さらにサンプリングが行われているものである。この変数名に対して、semantic integrationの技術を適用し、電子カルテデータの変数名や既存の試験のデータベース定義書から変数間のつながり、変換過程を記述する試みを行った。本研究で得られたPythonによるプログラミングの知識は、robotic process automationとして北海道大学病院データセンターにてデータマネージャの教育に利用した。
|