本研究では、生体分子の電子顕微鏡画像が与えられた際に、それに合致あるいは類似する立体構造を、立体構造データベースに登録された生体分子の中から選び出す計算機手法を開発した。その際、代表者が開発した疑似電顕画像作成手法とニューラルネットワークを組み合わせて用いた。 現在、データベースに登録されている約20万個の生体分子の構造のうち、電子顕微鏡で観測されるような大きな構造(約2万個)から電顕画像を作成し、機械学習用のデータセットとした。立体構造の大きさによってクラス分けを行い、各クラスで機械学習を行った。最も大きな構造クラスでは、正答率が約7割(上位3位までに正解が含まれるのは約9割)だった。
|