2019 Fiscal Year Research-status Report
Development of network of chronic kidney disease related factors and therapeutic target using big data and artificial intelligence and information and communication technology
Project/Area Number |
19K08740
|
Research Institution | Kawasaki Medical School |
Principal Investigator |
神田 英一郎 川崎医科大学, 医学部, 教授 (40401377)
|
Co-Investigator(Kenkyū-buntansha) |
柏原 直樹 川崎医科大学, 医学部, 教授 (10233701)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 慢性腎臓病 / AI / ICT / ビッグデータ / テキストマイニング / ネットワーク |
Outline of Annual Research Achievements |
現在、様々な疾患を対象として国内外で数多くの基礎・臨床研究が実施され、膨大な知見が集積されいるが、従来のハンドサーチによる文献検索に基づいた解析には限界がある。近年、人工知能(AI) ・情報伝達技術(ICT)を活用したデータマイニング技術が開発され、大規模データの解析が可能になってきている。そこで、本研究では、「インターネット上の医学情報および患者ビックデータをAI・ICT技術で解析することで、疾患に関係する新規病態因子や治療標的を開発すること」を目的とし、多因子による難治性疾患である慢性腎臓病(CKD)を対象として研究に着手し、以下の成果を得た。 テキストマイニングは大量の文字データを解析するツールである。そこで、インターネットから医学情報を取得し解析するため、我々はAIを活用したテキストマイニングシステム(AI-TMS)を開発し、MEDLINEからCKDに関する約30万件の論文データの自動抽出に成功した。次に、システムに読み込んだ全論文のテキストデータから自然言語処理を用いて医学用語を抽出しベクトル化した。得られた単語ベクトルはスパースであったため、ニューラルネットワークで解析し次元圧縮した。さらに、単語ベクトル間の関係を解析したところ、CKD関連因子の網羅的抽出を成功した。意味解析では抽出された因子はCKDとの未知の関係性を示した。 また、電子カルテから抽出した糖尿病性腎臓病患者(DKD)データベースを作成しDKD進行を予測する機械学習モデルを作成した。また、透析患者データベースを用いて生命予後を予測する機械学習モデルを作成した。これらのモデルは正確度95%以上を達成した。 本年度の成果によって、医学テキストデータのベクトル化による数値解析が可能になっただけでなく、医学テキストのビッグデータから疾患関連因子を網羅的に探索する新戦略の重要性が示された。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
我々は当初の予定通り、インターネット上の文献情報をダウンロードし解析することに成功し、解析システムを開発した。 テキストデータから医学用語の特徴ベクトルを得たことにより、CKD関連因子を網羅的に探索する方法論が確立したことは当初の予定よりも大きな成果を得られたと言える。また、DKD患者と透析患者の予後を正確に予測する機械学習モデルの開発にも成功した。このモデルは次の研究段階の基礎的なアルゴリズムとなる。
|
Strategy for Future Research Activity |
過年度に確立したAI-TMSによるCKD関連因子の網羅的探索結果を、実際のCKD患者データに適用して妥当性を検証する。そのため、まず電子カルテ情報から抽出したCKD患者データベースを構築する。次に、このデータベースを統計学的および機械学習学的手法を用いて解析することにより、AI-TMSによって抽出されたCKD関連因子とCKD進行(エンドポイント)との関係を明らかにする。また、CKD関係因子間の因果関係を有向グラフによるネットワークで表すとともに確率的推論による評価を試みる。
|
Causes of Carryover |
本研究では医学テキストデータおよび患者ビッグデータを解析する必要がある。そのためには、高速のCPUとGPU、大容量のメモリとハードディスクを装備したコンピュータを準備する必要があった。そのため、予算範囲内で最も高性能のワークステーションを購入した。さらに高性能のモデルでは予算を大幅にオーバーしてしまうため、次年度使用額が生じた。 次年度は、CKD患者の解析用データベースを作成し解析を開始する。そのため、PC周辺機器、統計解析ソフトなど解析に必要な物品の購入を検討する。また、学会発表や論文の執筆も行う。
|