機械学習に基づく計算機支援診断の開発が近年急ピッチで進んでいるが、課題となっているのは教師データの数の不足がある。臨床医師によって画像から腫瘍や細胞の種類をアノテーションする作業には相応の時間がかかり、また熟練を要することから、一般的な画像分類課題のように数万枚というデータを事前に用意するのは現状では困難である。 本研究では、深層学習を用いた教師なし学習による画像データのクラスタリングにより、病理組織画像から自動的に細胞画像をその特徴にもとづいて分類するアルゴリズムを構築、学習し、得られた画像クラスターが臨床的な細胞の特徴とよく一致することを示した。 学習データとして九州大学の大内田らによる膵臓がんのモデルマウスであるKPCマウスの腫瘍組織を用い、名古屋工大の本谷らの協力により染色方法の異なる二種類のスライスの位置合わせをおこなったものを用いた。二種類の染色画像をもとに細胞構造を画像から解析する畳み込みニューラルネットワークを構築し、特徴抽出を行うと同時に、Information Maximizing Self-Augmented Training (IMSAT)を改良した学習モデルによりクラスター間の相互情報量を最大化するように敵対的訓練によるクラスタリングを行う分類モデルを構築した。特徴パターンをお互いにを行い、8種類のクラスターに分類したところ、正常組織、血管、腫瘍、初期繊維化組織、後期繊維化組織、脂肪組織、細胞間ギャップ、および背景領域に分類できることがわかった。このモデルにより、腫瘍の領域、および繊維化の進行の度合いを強調して可視化することが容易になったと言える。 特徴抽出からのIMSATによる教師なしクラスタリングによる画像分類は、病理組織画像の他にも、さまざまな分野での画像解析に役立てることができるため、診断支援アルゴリズムの開発に大いに資することが期待できる。
|