研究実績の概要 |
最終年度、2)有機フラグメント構造設計プログラムの開発において、ケンブリッジ結晶構造データベースの構造データをsdf形式ファイルに変換するpython3.7対応CCOM2プログラムに関して、密度汎関数法(DFT)計算関連構造データでは見られなかったNaN(Not a Number、非数)の多数の発生、機械学習用ワークフロー型データ分析プラットフォームに取り込めない問題に直面した。これらの問題を解決し、ケンブリッジ結晶構造データベースから検索可能な150,461個のデータのSMARTS 3D Patternを含むsdf形式ファイルを作成した。 さらに、立体配座可変性予測システムSSSCPredsを用いて病原性は変わらないのに感染性が非常に高まったオミクロン株の解析を進め、季節変動性、細胞への侵入に対する効果が立体配座可変性により説明が可能であることがわかった。25th IUPAC International Conference on Physical Organic Chemistry (ICPOC 25) に参加し、SARS-CoV-2の解析を例示し、ディープニューラルネットワークへの展開にIUPAC規則94.2の立体配座命名法の選択則の改良が必要であること、三次元最大共通部分構造記述子の国際基準が必要になってくることについて発表を行った。 研究期間全体を通じて、提案している立体配座の記述法を用いて、最新のディープニューラルネットワークに応用可能か示すため、タンパク質立体配座可変性予測システムSSSCPredsを開発した。そのシステムは実用に足る精度を有しており、SARS-CoV-2の立体配座可変性予測マップが実験で得られた受容体結合ドメイン配列すべての一アミノ酸変異による配列-発現量マップ及び配列-結合マップと非常によい相関を示すこと、さらにはD614G変異で発現量が増大した原因について明らかにすることが出来た。
|