研究実績の概要 |
研究開始時に収集済みであった1052眼の網膜光干渉計(OCT)画像と、測定済みの233眼のサイトカインプロファイルと、1ヶ月後の視力を使って第一次データセットを作成した。サイトカインを測定された眼は、過去の研究で特定の条件の眼を選んだものであり、測定したサイトカインは既報を元にを選んだものである。従ってサイトカイン濃度の欠損値は「観測データに依存する欠損 (missing at random: MAR)」であり、欠損していないサイトカインの値からある程度欠損値推測が可能である。そこでまずサイトカインプロファイル中の欠損値を多重回帰分析で真の値を推定した。擬似完全データは、ベイズ統計学を用いて、欠損値の分布を元にマルコフ連鎖モンテカルロ法を用いて乱数を発生させて5セット作成した。サイトカインを全く測定していない多くの眼では、各サイトカイン濃度の分布を元にランダムに値を設定した。計算資源としては、NVIDIA A100 PCI Express Gen.4版 TENSOR コア GPU 1台を入手し、学習環境を構築した。一般画像を事前に学習させた各種深層ニューラルネットワークの出力と、個々のサイトカイン濃度を全結合させた新規ニューラルネットワークを試作した。試作した順に、AlexNet, VGG16, GoogLeNet, ResNet, DenseNet, Xceptionであり、層の数は代表的な3種類を試した。それぞれのニューラルネットワークごとにハイパーパラメータを変えて網羅的に学習を行った。1年掛けて全てのニューラルネットワークで学習を進めた結果、ResNet-34が最も高精度であったが、並行してデータ収集も進めたので、1年の区切りでそれらを追加して第二次データセットを作った。
|