研究全体を通じて医療分野での標準規格およびターミノロジーについて精査を行い、相互運用性について検討を行った。現在、国際的協調として実施されている臨床情報モデルの統一的構築の基盤となっているISO 13606規格を軸に多言語対応、複数ターミノロジー対応を行う中間情報モデルを開発した。この中間モデルを軸に自然言語処理の手法を用いて項目名、用語間の近さを判定して大学病院間の検査マスタを突合させることを試みた。JLAC10をターミノロジーとして使用したが、複数項目に同じコードが出現しているなどの問題点があった。負荷試験のために時系列に沿ってデータを格納するための配列などをクレンジングする必要があった。遺伝子検査など各大学独自コードについては、名称からのマッピングを試みた。ウイルス感染症などの血清学的検査については比較的高い適合率が得られたが、HbA1cなどの計法が複数あり、時代により変遷を伴うものは自動で突合することはできず候補として列挙するにとどまった。 さらに、複数データモデル間のマッピング試験としてMMLとHL7のマッピングを試みた。住所、患者氏名についてはほぼ確実に突合可能であったが、互いのユースケースが異なるために対応するスキーマが少なく突合作業自体が限定的なものとなった。 これらの成果については一部を学会にて報告し、現在論文として公開するための準備を進めているところである。
|