研究課題/領域番号 |
21K12111
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
小野 直亮 奈良先端科学技術大学院大学, データ駆動型サイエンス創造センター, 准教授 (60395118)
|
研究分担者 |
大内田 研宙 九州大学, 大学病院, 講師 (20452708)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 深層学習 / 病理組織画像 / 膵がん |
研究実績の概要 |
相互情報量最大化(IM)を適用する潜在変数の抽出に、VQ-VAEを使ったオートエンコーダーを用いて教師なし学習を行ったところ、これまでのオートエンコーダーやVAEを用いた場合よりも高い再現性が得られたため、この潜在変数をもとにクラスタリングと情報量最大化を適用することによってより細胞の形を反映した分類が得られるようになった。 また、潜在変数の構造を可視化するためにt-SNEおよび、UMAPを用いて2次元、また3次元空間へ分類されたクラスターを埋め込んだところ、はっきりとした空間構造が見てとれた。現在、このクラスター構造の尤度をもとに、ベイズ情報量基準(BIC)、および、広く適用可能なベイズ情報量基準(WBIC)を求めるための確率分布モデルを構築している。 加えて、構築した潜在変数への埋め込みモデルを元に、それぞれのクラスターごとに画像のどの領域の細胞が分類に寄与したかを逆伝播法を利用して評価するIntegrated Gradientを適用し、画像全体による評価だけでなく、どの領域の細胞がクラスタリングされているかを区別できるようにした。 IMを用いたこれまでの解析ではクラスターの数を先に決めておく必要があり、クラスター数そのものの選択にはもととなる病理画像を元にした医師の分類とアノテーションにより決めていたが、VQ-VAEとBICあるいはWBICを元にした定量的なモデル選択により、人によるアノテーションによらない教師なし分類による細胞構造の分類モデルを定量化する。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
潜在変数をクラスタリングし、WBICを評価するモデルの構築において、尤度を計算するための確率モデルが必要となる。この時、VQ-VAEを用いた場合は潜在変数の次元数が非常に高くなるため、PCAなどを用いて変数を削減する必要があるが、その場合、一般的にはクラスター数が増えるほど尤度が上がるべきところで、逆に尤度が下がっていくという状態になってしまっている。潜在空間において埋め込まれた構造が正規な分布にはなっていないためと考えられ、外れ値を避けるなどの工夫が必要になると考えられる。
|
今後の研究の推進方策 |
VQ-VAEを用いたオートエンコーダーで学習した潜在変数に対してIMを適用し、WBICによって最適なクラスター数を評価する。潜在変数の空間から適切な次元を選択することで、クラスター数の評価に使うことのできる尤度モデルを構築することができると考えている。
|
次年度使用額が生じた理由 |
コロナ禍により海外出張などがキャンセルになったが、ワクチンの接種など対策が進んできたため、翌年度に国際交流などを増やす計画である。
|