研究課題/領域番号 |
18K06198
|
研究機関 | 順天堂大学 |
研究代表者 |
茂櫛 薫 順天堂大学, 大学院医学研究科, 非常勤講師 (60569292)
|
研究分担者 |
島田 周 東京医科歯科大学, 大学院医歯学総合研究科, 助教 (20609705)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
キーワード | バイオインフォマティクス / 仮想ダイセクション法 / 教師なし学習 / 遺伝子発現解析 |
研究実績の概要 |
本課題では、ヒト臨床検体(正常・炎症・癌組織)の遺伝子発現情報から、組織内に含まれる細胞群の混合率を推定するアルゴリズムを開発する。細胞種が混在した正常・炎症・癌などの組織の発現パターンを公共データベースから入手し、機械学習の一つである「教師なし学習」を用いて、各細胞群のリファレンスとなる発現パターン(リファレンス発現パターン)とそれらの混合比を検体ごとに推定する。さらにリファレンス発現パターンを用いて、新規に得られた検体の発現プロファイルに対して細胞群の混合比を算出し、研究者に提示するようなウェブシステムを構築する。 まず、アルゴリズムの方向性や前処理のパラメーターの評価・検討を行うため、既知の割合で混合したラット組織の公開発現データによる予備解析を実施した。また、TCGA (The Cancer Genome Atlas)にて公開されている肝細胞癌、乳癌、肺癌などのRNA-seqの発現情報を用いて、それぞれのがん種における細胞種の共通パターン推定を行った。また、それぞれのリファレンス発現パターンの生物学的意義の解釈を進めるとともに、がん横断的な類型パターンの収集とカタログ化を目指した。これらのソフトウェアのクラウド環境への移行を実施し、評価を進めた。 2021年度は精度向上を目的とし、nsprcompやNMFの代わりに深層学習の手法を取り入れ、オートエンコーダーによる細胞種の混合比の推定方法に関する検討も実施した。混合比は非負の値となるため、各ウェイトの係数は非負の制約のもとで推定を行った。現段階ではnsprcompやNMFと比べると十分な定量性は得られないことやパラメーター推定に時間が掛かるなどの原因で解析アルゴリズムとして採用は難しい段階であるが、引き続き評価・開発を進めたいと考えている。
|