本研究課題では,バイオ医療画像解析特有の対象構造事前知識を用いることで,機械学習に必要な学習データを自動抽出し,アノテーション作業を省力化することを目的とする.一部の正例とたくさんのラベル不明サンプルのみから識別を可能とするPositive Unlabeled(PU) Learningを活用した研究開発を行った.前年度に行った課題の研究推進に加えて,2020年度は,下記の新規の2つの研究課題を進めた. 1)病理画像の癌細胞認識へのPU Learningの活用:1枚の病理画像中に数万個の細胞が存在し,個々の細胞にアノテーションすると手間がかかる.そこで,「同一の細胞種が集中して存在」に着目し,領域を囲みその中の細胞全てに一度にラベルを付与することで簡便にアノテーションが可能とした.このとき,正常細胞領域には正常細胞しか含まれないことから正例サンプルとして扱うことができ,がん細胞領域の中には正常細胞も含まれるためラベル不明サンプルとして扱うことで,PU-Learningを適用可能となる.この手法開発を進め効率的なアノテーションを実現することを可能とした. 2)不十分なアノテーションからの細胞検出へのPU Learningの活用:細胞検出用の学習データを作成するためには,画像中の膨大な数の細胞に網羅的に付与する必要がある.そこで,画像中の一部の細胞のみの学習データからでも学習を可能とする手法の開発を行った。この問題では,一部のアノテーションされた細胞を正例サンプルと捉え,それ以外の候補はラベル不明サンプルとして扱うことで,PU Learningを活用可能となる.この手法開発を進め,部分的なアノテーションからも高精度に細胞検出を可能とした. これらの研究開発の結果,学会発表1件,査読付き論文投稿3件(内1本採択済み、査読中2本),書籍執筆1件,解説記事1件の成果につながった.
|