平成29年度には構造予測改良法のさらなる改善のためにProtein Data Bank(PDB)の情報を最大限に利用するための解析手法の改良を行った。これまでに広く使われてきたPDB形式は記述できる原子数やサブユニット数の制約のためにPDBから推奨されなくなってきており、より詳細なメタデータ情報を含めてどのような大きさ・数の分子でも記述できるPDBMLやmmCIF形式への移行が必要となった。そこで、本研究で開発したプログラムにおいてmmCIFファイルを処理するように改変を行った。これにより、近年クライオ電子顕微鏡などの技術革新によって生じた大規模な構造のデータを含めて網羅的に利用できるようになった。これらの立体構造については主鎖の二次構造、側鎖の水素結合・Cation-π相互作用・van der Waals相互作用などの原子間コンタクト、残基の埋もれ度によって部分構造を分類しデータベース化した。これらのPDBの構造についてはヒトタンパク質のアミノ酸配列と網羅的な配列相同性検索と配列アラインメントを行い、立体構造が未知のヒトのタンパク質の構造予測とその改良に利用できるようにした。 立体構造情報を利用したタンパク質構造予測の改良の具体例としてGタンパク質共役型受容体(GPCR)の構造情報の活用についての検討を行った。GPCRはヒトゲノムにおいて約800種類存在する重要な創薬ターゲットであるが、立体構造解析がされているものはごく少数であり、構造解析の難しさからヒト以外のホモログで解析されたり様々な変異が導入されたりする。ヒトのGPCRにおいて実験的に解析された立体構造から天然の配列を持った立体構造をモデリング・改良することでGPCRの創薬研究等に応用可能なモデルを作成した。
|