平成25年度は開発したタンパク質―リガンド結合部位組合せデータベースであるProtein Ligand Binding Site Pair (PLBSP)を中心に、主要なタンパク質および化合物の公共データベースの情報をセマンティックウェブに対応させRescorce Description Freamwork (RDF)でリンクした。具体的にはPDB、UniProt、PDB CCD、ChEBIなどである。また、PLBSPでは原子間相互作用の組合せと距離を取り扱ったが、データサイズが長大になることや残基同士の組合せを解析したいという要求から、タンパク質―リガンド結合の残基組合せについて再編纂したPLBSPResidue。タンパク質の鎖(chain)ごとに構造ドメイン、配列、文献、分類学などの主要データベースへのリンク情報を持つEBIのSIFTSをRDF化した。これにより、タンパク質―リガンド結合部位組合せの解析結果のアノテーションをより充実させることができた。本研究において作成・統合されたデータベースは、インタラクトーム(網羅的な分子間相互作用の研究)Linked Open Data (LOD)としてデータベースへ実装、Webで公開した。この意義はデータベースを情報資源としたアプリケーションを効率的に開発できるようになった。機械学習による糖や金属、低分子化合物と結合するタンパク質の部位(残基)予測ツールが開発され、Webで利用可能なパイプラインソフトウェアの機能を短期間で拡張することができた。結果のソフトウェアはhttp://utprot.netにおいてUTProt Galaxyとして公開している。研究の目的であるファイトレメディエーション効率化のための植物のオミクス解析に向けた、タンパク質―リガンド結合部位のデータベースと予測ツールを開発することができた。
|