2020 Fiscal Year Annual Research Report
Implementing and Evaluating Prediction of Dynamical Item Appearance Depending on Fluctuation of Multiple Item Values
Project/Area Number |
20H04192
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
横田 治夫 東京工業大学, 情報理工学院, 教授 (10242570)
|
Co-Investigator(Kenkyū-buntansha) |
荒木 賢二 宮崎大学, 医学部, 教授 (70274777)
山崎 友義 宮崎大学, 医学部, 研究員 (50586609)
串間 宗夫 宮崎大学, 医学部, 研究員 (00727414)
小川 泰右 宮崎大学, 医学部, 助教 (60586600)
松尾 亮輔 宮崎大学, 医学部, 研究員 (30815931)
Le Hieu・Hanh 東京工業大学, 情報理工学院, 助教 (60813996)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | シーケンス解析 / 項目推薦 / 値予測 / 電子カルテ / 医療検査 |
Outline of Annual Research Achievements |
大量の履歴データのシーケンスから傾向を抽出し、次の項目や値を予測し、さらには予測に基づいて推薦を行う処理には広範の需要があり、重要度が増している。しかし、シーケンス中の複数項目の値の変動に依存して項目の出現が動的に変化する場合に、次に発生する項目を予測することは、従来の手法では不可能である。例えば、電子カルテデータに含まれる複数の医療検査項目の値の変動から、次にすべき検査項目や医療指示を予測することは従来のシーケンス解析では不可能であった。本研究では、同時に発生する複数の項目の値の変動の依存関係を抽出して次に発生する項目を予測する手法を実現し、実際に蓄積された電子カルテの医療検査項目の履歴に適用して傾向を解析することを目標に研究を進めている。 具体的な手法として、まず、電子カルテデータに含まれる検体検査項目で同時に実施される検査項目から、クラスタリング手法を用いて複数の検査グループにクラスタリングし、抽出された検査グループ毎の特性ベクトルを作成する。次に、各検査グループの検査結果の中の異常値を、基準範囲の上方に外れるHと、下方に外れるLで示した特性ベクトルも用意する。それらの特性ベクトルのシーケンス解析を行うことで、検査グループ間の推移を抽出し、次の検査項目群を推薦する手法を提案した。その提案手法を、宮崎大学病院に蓄積されている実際の電子カルテデータベースに含まれる検体検査データに適用して精度の評価を行い、効果を示した。実験に用いた電子カルテデータは宮崎大学病院内で匿名化し、物理的な電子媒体に格納して解析を行う東京工業大学に運搬した。東京工業大学内においても、専用のサーバに格納し、外部から切り離して解析を行った。提案手法とその評価結果に関して外部発表を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
具体的な例として、電子カルテデータに含まれる複数の検査項目の値の変動から次にすべき検査項目の予測を行う手法の提案を行い、結果を得ている。また、その内容に関して、外部発表を行っている。つまり、目標に沿って研究を進めて、結果を得ることができており、進捗状況としては、極めて十丁であると認識している
|
Strategy for Future Research Activity |
2020年度に行った実験では、検査項目が複数の検査グループに属さないハードクラスタリングを行ったが、複数の検査グループに属するソフトクラスタリングが適することが分かっている。このため、2021年度は、クラスタリング手法の改善を行うことを計画している。また、複数検査項目の変動の影響を与える対象を次の検査項目として検査項目の推薦とその評価を行ったが、検査結果は医療指示にも影響を与える。2020年度においても、医療指示のシーケンスの解析を行い、そのバリアントの分岐の因子として一部の検査情報は用いたが、十分ではなかった。2021年度は、医療指示と検査グループを組み合わせて用いる手法の検討を進める。さらに、電子カルテに含まれる診断記録等のテキストデータに含まれる固有表現の部位とその状況のような情報も、一種の複数項目とその値のように扱うことができるか、さらに、それらと検体検査情報、医療指示と組み合わせることで、さらに精緻なシーケンス解析ができないかの検討を行う。
|