2017 Fiscal Year Research-status Report
人工知能を応用したデータマイニングによる糖尿病合併症危険因子発見に関する研究
Project/Area Number |
16K09178
|
Research Institution | Kagoshima University |
Principal Investigator |
村永 文学 鹿児島大学, 医歯学域附属病院, 講師 (00325812)
|
Co-Investigator(Kenkyū-buntansha) |
熊本 一朗 鹿児島大学, 医歯学域医学系, 教授 (40225230)
宇都 由美子 鹿児島大学, 医歯学域医学系, 准教授 (50223582)
岩穴口 孝 鹿児島大学, 医歯学域附属病院, 看護師 (80619198)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 糖尿病合併症 / データマイニング / 機械学習 |
Outline of Annual Research Achievements |
本研究は、国民病と言われる糖尿病にターゲットし、糖尿病合併症の発症に関与する因子の発見について、データマイニング技法を用いた研究を行った。 平成28年度は、主に、医療ビッグデータ・ウェアハウスシステムを構築し、病院情報システムから、患者基本情報、病名、処方、注射、看護、検体検査・電子カルテ記事等のデータを抽出し、連結不可能匿名化処理を行った。病名の有無、薬歴、検査結果値、バイタルデータ等の数値化可能なデータについては、各項目に閾値を設定し、2値データとして蓄積した。カルテの記事及び看護観察記録等の自由文については、UTF-8コードに変換後、MeCabシステムで形態素分析を行い、データウェアハウスに格納した。形態素分析用の医学用語辞書としてComeJisyo及び独自に整備した医学用語集を利用した。 平成28年度は、データマイニング用クライアントPCの環境構築と、データマイニングアプリケーションの開発を行った。2値情報から、糖尿病合併症を発症した症例の発見を行った。まずは診療ガイドライン等を参考に、各項目に設定した閾値を超えた症例を抽出した。例えば糖尿病性腎症の場合は、病名が存在する・またはe-GFRが閾値以下となった症例群を抽出した。次に、多層ニューラルネットワークのTenserFlowシステム及びPythonで独自に開発したニューラルネットワークライブラリに発見した症例のデータを機械学習させ、データ的に類似症例を発見できるか試行した。 自由文については、GenSimライブラリのDoc2Vecを利用して、抽出した症例に記録が類似している症例が無いか探索した。発見された類似症例について、診断基準を満たしているか、診断基準を満たしていない場合に、検査漏れ等が無いか、特徴的な検査結果・記録は無いか等、詳細に分析中である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
糖尿病合併症を発症した症例の特定とデータウェアハウス構築は完了しており、現在、多層ニューラルネットワークのライブラリ等を試行しながら、合併症を発症した症例の発見手法について試行錯誤を行っている。 自由文については、本教室の大学院生が、看護観察記録から誤嚥性肺炎を発症する可能性のある症例を発見する為の研究を行い、成果がでたので、その成果を本研究にも応用する計画である。
|
Strategy for Future Research Activity |
最終年度である平成30年度は、構築したデータマイニングツールの性能評価を行い、データウェアハウスの構造・データクレンジングの方法、各アルゴリズムの実装方法から最適化等、あらゆる方面で改良し、各アルゴリズムの評価を完了し、糖尿病合併症発症の危険因子の発見を行いたい。可能であれば、学習によって強化した人工知能とデータマイニングエンジンを結合し、糖尿病合併症を発症する危険因子を保有する患者について、主治医に自動的に報告するシステムの開発まで行いたい。本研究の成果によって、糖尿病合併症の発症因子が発見できる可能性がある。また、他の疾患の発症因子、重症化因子の発見にも応用可能であると思われる。
|