本研究では、「精神疾患の病因研究におけるビッグデータ解析の利用可能性」を探索するために、3つの研究課題を行った。 「1)国内最大規模のSNPデータベースを用いた精神疾患への寄与パターンの探索」では、主に学習させるデータ量が不足しているために発生する機械学習の過学習の問題によって適切な結果を得ることができなかった。 「2)安静時機能的脳MRI画像を用いた発達障害型の行動的傾向の神経学的基盤の探索」では、新型コロナウイルス感染症流行に伴う実験環境の障害によって、研究に妥当な規模のデータベース取得を達成できなかった。 「3)機械学習を用いた画像認識技術による性周期判定ソフトの開発」では、必要なデータ(約3300枚の雌マウスの膣スメア画像)の獲得と、その画像から細胞診を行うコンピュータプログラムの開発という進捗を得られた。各画像が示す性周期のphase情報をあらかじめ熟練研究者が判定し、画像データとは別の「正答」データとした。そのうち約2000枚を訓練画像としてPythonベースの畳み込みニューラルネットワークプログラムに投入、より高精度で正答にたどり着く"読影法"を学習させた。訓練に用いていない残りの画像から、約500枚の評価用画像セット、約700枚のテスト用画像セットを作成した。評価用画像およびテスト用画像の示す性周期phaseをプログラムに判定させたところ、各phaseで90%前後の判定制度を得た。テスト用画像による判定精度比較で、プログラムは熟練研究者に並ぶ高精度での判定ができることがわかった。成果は英文学術論文に掲載された。また、開発したプログラムをソフトウェア開発プラットフォームであるGitHubにて、学習に用いた画像データセットを千葉大学学術成果リポジトリ CURATORにて、それぞれ公開した。
|