2021 Fiscal Year Research-status Report
分散学習ネットワークモデルを用いた病理組織画像の特徴抽出の最適化
Project/Area Number |
21K12111
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
小野 直亮 奈良先端科学技術大学院大学, データ駆動型サイエンス創造センター, 准教授 (60395118)
|
Co-Investigator(Kenkyū-buntansha) |
大内田 研宙 九州大学, 大学病院, 講師 (20452708)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 深層学習 / 病理組織画像 / 膵がん |
Outline of Annual Research Achievements |
相互情報量最大化(IM)を適用する潜在変数の抽出に、VQ-VAEを使ったオートエンコーダーを用いて教師なし学習を行ったところ、これまでのオートエンコーダーやVAEを用いた場合よりも高い再現性が得られたため、この潜在変数をもとにクラスタリングと情報量最大化を適用することによってより細胞の形を反映した分類が得られるようになった。 また、潜在変数の構造を可視化するためにt-SNEおよび、UMAPを用いて2次元、また3次元空間へ分類されたクラスターを埋め込んだところ、はっきりとした空間構造が見てとれた。現在、このクラスター構造の尤度をもとに、ベイズ情報量基準(BIC)、および、広く適用可能なベイズ情報量基準(WBIC)を求めるための確率分布モデルを構築している。 加えて、構築した潜在変数への埋め込みモデルを元に、それぞれのクラスターごとに画像のどの領域の細胞が分類に寄与したかを逆伝播法を利用して評価するIntegrated Gradientを適用し、画像全体による評価だけでなく、どの領域の細胞がクラスタリングされているかを区別できるようにした。 IMを用いたこれまでの解析ではクラスターの数を先に決めておく必要があり、クラスター数そのものの選択にはもととなる病理画像を元にした医師の分類とアノテーションにより決めていたが、VQ-VAEとBICあるいはWBICを元にした定量的なモデル選択により、人によるアノテーションによらない教師なし分類による細胞構造の分類モデルを定量化する。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
潜在変数をクラスタリングし、WBICを評価するモデルの構築において、尤度を計算するための確率モデルが必要となる。この時、VQ-VAEを用いた場合は潜在変数の次元数が非常に高くなるため、PCAなどを用いて変数を削減する必要があるが、その場合、一般的にはクラスター数が増えるほど尤度が上がるべきところで、逆に尤度が下がっていくという状態になってしまっている。潜在空間において埋め込まれた構造が正規な分布にはなっていないためと考えられ、外れ値を避けるなどの工夫が必要になると考えられる。
|
Strategy for Future Research Activity |
VQ-VAEを用いたオートエンコーダーで学習した潜在変数に対してIMを適用し、WBICによって最適なクラスター数を評価する。潜在変数の空間から適切な次元を選択することで、クラスター数の評価に使うことのできる尤度モデルを構築することができると考えている。
|
Causes of Carryover |
コロナ禍により海外出張などがキャンセルになったが、ワクチンの接種など対策が進んできたため、翌年度に国際交流などを増やす計画である。
|
Research Products
(1 results)