本研究は、組織検査で最も広く用いられるH&E(ヘマトキシリン&エオジン)染色という染色法によって得られた組織スライドイメージを主に用いて、予後因子に関わる組織の空間的な特徴を探索する研究である。本年度は、研究計画上のSTEP0(研究サーバーの組み立て)からSTEP3(予後因子の探索)までを実施し、予後因子探索のための初期パイプラインを構築した。具体的には、 TCGA(The Cancer Genome Atlas)の5つのコホートに対して、コホート別に予後予測モデルを最適化した。最適化されたモデルから、コホート別にスコア上位1%以内(高危険群)のタイルとスコア下位1%以内(低危険群)のタイルを抽出した後、細胞(核)の検出をPanNukeデータセットを学習したHover-Netを用いて行なった。その検出結果から、高危険群と低危険群の細胞の数を統計的に比較した。その結果、低危険群でがん細胞の細胞数が多い傾向と、肺がんコホートの低危険群で炎症細胞の細胞数が多い傾向を確認した。さらに、炎症細胞の細胞密度が局所的に高いことが低危険度を予測する予後因子である可能性を検証した。Whole slide imageから細胞核の局所的な密度を定義するために細胞核をポイント(点)としてボロノイ図を計算し、ボロノイ細胞の大きさの分布密度を確認した。その結果、高危険群でのボロノイ細胞の大きさの分布密度が他の群と異なることが確認された。この結果は、炎症細胞の局所的な密集が予後因子のひとつとしてみなせる可能性を示唆する。
|