2016 Fiscal Year Research-status Report
人工知能を応用したデータマイニングによる糖尿病合併症危険因子発見に関する研究
Project/Area Number |
16K09178
|
Research Institution | Kagoshima University |
Principal Investigator |
村永 文学 鹿児島大学, 医歯学域附属病院, 講師 (00325812)
|
Co-Investigator(Kenkyū-buntansha) |
熊本 一朗 鹿児島大学, 医歯学域医学系, 教授 (40225230)
宇都 由美子 鹿児島大学, 医歯学域医学系, 准教授 (50223582)
岩穴口 孝 鹿児島大学, 医歯学域附属病院, 助教 (80619198)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 人工知能 / テキストマイニング / データマイニング / 糖尿病合併症 / Python |
Outline of Annual Research Achievements |
本研究では、国民病と言われる糖尿病の合併症の発症に関与する因子の発見について、データマイニング技法を用いた研究を行う。特に、人工知能(ディープラーニング等)による機械学習を応用し、記事情報等の非定形的な情報からの因子抽出の実現について、従来のTF-IDF法等のテキストマイニング手法では解析不可能であった解析手法の確立に重きを置く。本研究の成果によって、糖尿病合併症の発症因子が発見できる可能性がある。また、他の疾患の発症因子、重症化因子の発見にも応用可能であると思われる。 平成28年度は、主に、医療ビッグデータ・ウェアハウスシステムを構築し、総合病院情報システムの薬歴・検査結果・電子カルテ記事データ・バイタルサイン・看護記録データを抽出し登録した。 さらに、データマイニング用クライアントPCの環境構築と、データマイニングアプリケーションの開発を行った。 加えて、医療情報学連合大会や人工知能学会への参加、書籍類の購入により、人工知能関連の情報収集も行った。その中で、人工知能システム開発用使用言語としてはPythonが有力であることが判明した。データマイニングや人工知能関連のライブラリが大変豊富であり、巨大な配列演算を容易に行える環境にあった。多くの人工知能の研究者がPythonを利用していることも判明した。 現在は、GoogleのPython用、人工知能ライブラリであるtensorflowと、テキストマイニングライブラリである、GenSimの評価を、共同研修者と共に行っている。具体的には、Pythonによるword2vec、doc2vecの評価を行い、多くの記事の中から、特徴となる語を抽出できるのか、等の評価を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
人工知能処理用のサーバの構築、人工知能関連の情報収集も完了した。 現在、Pythonの人工知能ライブラリの評価を行っており、テストデータから、幾つかの成果となりえる結果もえることができた。
|
Strategy for Future Research Activity |
まずは、GoogleのTentorflowとGenSimライブラリを完全に使いこなせるように研究する。 29年度は、糖尿病合併症を発症した例から、機械学習を行い、少なくともシミュレーションデータで合併症発症患者を発見できるか否かについてまで、評価を行いたい。
|