2018 年度実績報告書

深層学習エンジンを用いた疾患予測システムの研究

研究課題

研究課題/領域番号	17K19927
研究機関	慶應義塾大学
研究代表者	満山進慶應義塾大学, 医学部(信濃町), 特任助教 (30296727)
研究期間 (年度)	2017-06-30 – 2019-03-31
キーワード	深層学習 / 予測 / モデル化 / 疾患 / 遺伝子変異 / タンパク質ドメイン / 解析ツール / データベース
研究実績の概要	前年度に取得した米国NCBIのRefseqヒト遺伝子タンパク質アミノ酸残基配列のデータ113,373件についてEBI-EMBLのInterProScanを使用して検索を行った275,265件のタンパク質ドメインと疾患関連遺伝子変異データベースHGMDの8,613遺伝子の遺伝子変異を用い、タンパク質ドメインと遺伝子の領域について対応付けを行い、Missense、Small deletion、Small insertion、Small indelの各変異についての一覧の作成を行った。HGMDの中にはNCBIの一塩基型データべース(dbSNP)の病原性遺伝子多型のデータを含んでいる。その結果、4,929遺伝子、2,522個のタンパク質ドメインと疾患の対応付けが出来た。タンパク質ドメインの中の変異が一つのものを除いた1,477個のデータを用いて、米国Googleが開発し無償で供給をしている深層学習プログラムTensorflowにより疾患予測プログラムの開発を行った。プログラムは、入力層、中間層、出力層からなる３層ニューラルネットワークを使用して学習モデルの構築を行った。その結果からタンパク質ドメイン中の遺伝子変異と関連する確率の高い疾患の予測を行った。その結果、3-methylcrotonyl-CoA carboxylase deficiency、Adrenoleukodystrophy、Cystic fibrosis、Glutaricacidaemia、Gyrate atrophy、Stargardt diseaseの6疾患について相関が見られた。この結果は、Webページ(http://cancerproview.jp/disease)で検索を行える。遺伝子パスウェイについては、KEGGやBioCartaなどのデータベースに対応できる疾患関連遺伝子検索ツールの作成を行った。

研究成果
(2件)

すべて 2018 その他

すべて学会発表 (1件) 備考 (1件)

[学会発表] CanceProView:がん関連疾患遺伝子/タンパク質相互作用データベース2018
- 著者名/発表者名
  満山　進
- 学会等名
  第76回日本癌学会学術総会
[備考] Predict Disease Search
- URL
  http://cancerproview.info/disease/