2020 Fiscal Year Annual Research Report
Technology development and application for cell surface visual proteomics
Project/Area Number |
19H04209
|
Research Institution | Aoyama Gakuin University |
Principal Investigator |
諏訪 牧子 青山学院大学, 理工学部, 教授 (30242241)
|
Co-Investigator(Kenkyū-buntansha) |
佐藤 主税 国立研究開発法人産業技術総合研究所, 生命工学領域, 上級主任研究員 (00357146)
池田 修己 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (20415772)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | ビジュアルプロテオミクス / 膜タンパク質 / 電子顕微鏡写真 / 立体構造 / 深層学習 |
Outline of Annual Research Achievements |
2020年度は、課題1と課題2-1を継続するとともに、以下の研究を行った。 【課題2-2】複数の電子顕微鏡画像をリファレンス画像として新たに撮影したが、まだ枚数が不足していたため、輪郭を鮮明化したタンパク質像を大量には得られず、膜面に垂直な軸に対する膜タンパク質の傾き角度が異なる画像にクラスター化するまでは行かなかった。 【課題2-3】課題1で構築したDB中の立体構造投影像と、膜に垂直方向に対する傾き多型集団の画像に対して特徴量(面積、円形度、周囲長など)、膜面に投影した原子集積度(輝度で表示)を計算し疑似電顕画像を作成した。これら擬似電顕画像と照合させることで,実際の電顕画像(以下、実電顕画像)上のタンパク質ファミリーを推定する3種の識別手法(輝度マッチング,特徴量マッチング,深層学習:VGG16モデル)を開発した. EMDB中の実電顕画像を用いて、実電顕画像と同一ファミリーの疑似電顕画像が照合される際の正解スコアと,異なるファミリーと照合される際の不正解スコアの分布を解析したところ、一定の閾値以上での感度は、輝度マッチングが87.8%,深層学習が66.7%,特徴量マッチングが54.3%となり、輝度マッチングが最も高精度であった。 次に電顕画像に対応する立体構造座標が決定されていない場合についても照合方法の開発に取り組んだ。配列から膜貫通へリックス領域を予測して、電顕画像に最適配置する手法に関しては、2020年度は膜貫通ヘリックスのみならず、ベータストランド、コイルなど別種の二次構造も含めて予測する方法を検討した。またEMDB中の電子顕微鏡画像から実面積を求め、膜タンパク質ファミリー名と対応させたところ、電子顕微鏡画像の面積からは、単一のファミリーを推定することは難しいが、複数のファミリー候補の絞り込みには利用できることが判った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2020年度は、課題1と課題2-1を引き続き継続するとともに、新たに以下の課題に取り組んだ。 【課題2-2】膜タンパク質のリファレンス画像としての電顕画像を新たに撮影したが、枚数がまだ不足しているため、輪郭を鮮明化したタンパク質像を得ることができず、膜面に垂直な軸に対する傾き角度が異なる複数の画像にクラスター化するところまでは行かなかった。2021年度も、リファレンス画像として、電子顕微鏡写真の撮影を進め、この課題を引き続き行う必要がある。 【課題2-3】膜タンパク質の立体構造から作成した擬似電顕画像と照合させることで,実際の電顕画像(以下,実電顕画像)上のタンパク質ファミリーを推定する3種(輝度マッチング,特徴量マッチング,深層学習:VGG16モデルを使用)のファミリー識別手法を開発した。これらの評価から、輝度マッチング手法の感度が最も良く、高精度であることが判った。この結果から、2021年度以降のツール開発や応用への方針を決めることができたため、当初の目標よりも進展したと考える。 電顕画像に対応する立体構造が無い場合に向けた照合を試みた。配列から膜貫通へリックス領域を予測して、電顕写真に最適配置する手法に関しては、膜貫通ヘリックスのみならず、別種の二次構造までを同定できる方法を検討したので、2021年度はこの手法も応用しつつ、へリックス軸間距離、傾き角度などを束縛条件にしながら最適配置する手法を検討する。電子顕微鏡画像の面積を用いた場合、単一のファミリー名を推定することは難しいが、複数のファミリー候補の絞り込みには利用できるという方針が見いだせた。 以上の進捗は、当初の計画に対して多少遅れているものと、予想以上に進展したものがあるため、総合しておおむね順調に進展していると評価した。
|
Strategy for Future Research Activity |
2021年度は、主に課題3を行う。課題1と課題2についてもデータ更新、アルゴリズム改良等を継続する。 【課題2】2020年度までに開発した照合プログラムに深層学習法も加えて高精度化させる。深層学習については、新たな電子顕微鏡写真を撮影することに加え、疑似画像を作成することで学習セットを増量し、照合の高精度化を目指す。 【課題3】前年度までに開発した全膜タンパク質統合DBおよび、画像照合プログラムをもとに、統合DBと連携してシームレスに動作するWEBシステムを構築する。これを利用し、細胞表面の膜タンパク質に機能情報を与える可能性を検証する。WEBシステムは、生体膜の二次元電顕画像に対して、生物種や、細胞小器官に存在する膜タンパク質を絞ったうえで、立体構造投影画像を逐次、二次元電顕像に照合し、ヒットした立体構造に対して全膜タンパク質統合DBから機能情報を提示できるようにする。 WEBシステムを応用する対象として最初にホタテの骨格筋を覆う小胞由来ベシクルに注目する。この表面に存在するタンパクの名前や構造を推定し、ATP濃度、Ca濃度変化などに伴うベシクルの形態変化と、タンパク質集団の構造変化の相関性を解析する。この骨格筋小胞膜は、リファレンス画像としても用いるため、WEBシステムができてから解析するというよりは全研究期間を通じて扱うことになる。従って期間途中で生物学的に興味ある現象が見られれば随時論文にする。
|
Research Products
(2 results)