蛋白質の簡易型シースエンス立体構造データベースが完成したので報告する。この研究の目的はタンパク質の立体構造データベースProtein Data Bank(PDBと略する)のデータを検索するシステムを構築することである。例えば、タンパク質名、著者名からそれらの属性を持つPDBのエントリー名をアクセスしたり、部分シークエンスを指定し、そのシークエンスを持つPDBのペプチド断片の座標をピックアップすることなどである。Protein Data Bankでは検索システムは提供されていないので、ユーザー側で検索システムを作る必要がある。最初から検索システムを作るのは困難と考えられるので、既存のプログラムがあればそれを利用することを考えた。 本研究において作成したデータベースは、データベースのデータと検索プログラムからできている。検索プログラムは米国National Biomedical Research Foundationにおいて開発されたProtein Identification Resource(PIRと略する)のプログラムPSQを少し改造したものを用いた。したがって、ユーザはタンパク質のシークエンス検索するのと同じ要領でPDBの検索ができる。データ構築プログラムは今回の研究で独自に作成した。このプログラムはPDBから必要なデータを取りだし、PIRのデータフォーマットに変換するプログラムである。本データベースシステムはDEC社のVAX/VMSコンピュータ上で稼働する。
|