2021 Fiscal Year Research-status Report
機械学習による形態的特徴量を用いたiPS細胞由来洞結節細胞の選別と分子基盤の解明
Project/Area Number |
20K08423
|
Research Institution | Tottori University |
Principal Investigator |
久留 一郎 鳥取大学, 医学部, 特任教員 (60211504)
|
Co-Investigator(Kenkyū-buntansha) |
三明 淳一朗 鳥取大学, 医学部, 准教授 (40372677)
經遠 智一 鳥取大学, 医学部, 助教 (60730207)
白吉 安昭 鳥取大学, 医学部, 准教授 (90249946)
森川 久未 国立研究開発法人産業技術総合研究所, 生命工学領域, 研究員 (90707217)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | iPS細胞 / ペースメーカ細胞 / 深層学習 |
Outline of Annual Research Achievements |
2020年度にヒトiPS細胞をゲノム編集並びにBACベクターを用いてHCN4とShox2にeGFP及びmCherryをレポーターとして導入し、cell sorterによりHCN4/Shox2二重陽性細胞を採取し、その形態の顕微鏡画像とパッチクランプ法による自動能活動電位から洞結節型と非洞結節型に分類した、作成した洞結節細胞型自動能を呈した細胞の白黒画像を正解画像とし非洞結節細胞型自動能を呈した細胞の白黒画像を不正解画像としてそれぞれを教師データ並びに検証データとして用意した。細胞が示された画像を入力し、画像中に含まれる細胞がSA型細胞であるか、非SA型細胞であるかを機械学習モデルによって予測し、予測結果を出力できるか否かという領域推定とSA型か否かという二値分類推定を行う事を目的にして準備を行った。データとして、心筋細胞の顕微鏡画像計85枚を使用して学習及び検証を行った。SA型と非SA型は、「基準洞結節」内に保存されていたデータを元に設定している。グループ1、2、3は、それぞれデータ数36, 28, 21であり、その中でSA型データ数はそれぞれ19, 11, 12、非SA型データ数はそれぞれ17, 17, 9であった。グループ1、2、3のそれぞれについて、SA型の数と非SA型の数の割合が変わらないように無作為に80%のデータを選択し、それを学習用データとして使用した。残りの20%のデータを検証用のデータとして使用した。機械学習を行うのに85枚の画像では少ないため、画像の一部分を切り取り、それをデータとして利用した。切り取った画像のうち、細胞が画像内に含まれないものについては学習及び検証データとして使用していない。この操作により、画像は合計5415枚となった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
現在、領域推定、二値分類ともに、Convolutional Neural Network(CNN)を用いて予測モデルを作成する。領域推定は、U-netを元にしたモデルを作成し、利用する。U-netは入力、出力共に画像となるような予測モデルである。入力画像、出力画像のサイズは、問題に合うように調整している。二値分類は、VGG16を元にしたモデルを作成し、利用する。VGGは入力が画像で、出力が二値分類、もしくは多クラス分類等に使える複数の値となるような予測モデルである。画像をSA型細胞のある領域、非SA型細胞のある領域、細胞の無い領域に塗り分ける領域推定の問題と、画像に含まれる細胞がSA型、非SA型のどちらであるか予測する二値分類の問題として解くことが出来るかを検討すべく実装を行っている。
|
Strategy for Future Research Activity |
今後は現在準備したデータを用いて、深層学習を実装させる予定である。具体的には領域推定モデルに関しての損失関数を求めて、損失関数が収束するか否かを検証する。また、実際に1個の細胞のどの領域をSA型と認識できるかを検証する。領域推定モデルの損失関数が収束しない場合は、より単純な二値分類の問題として解くことを検証する。これらの方法を用いて、精度、確度、感度並びにROCAUCによりそれぞれのモデルの性能指標を求める。
|