研究概要 |
癌関連遺伝子とその産生されるタンパク質のパスウェイやドメインと関与する疾患をグラフィカル表示するシステム開発のために文献検索を行った。さらにLocus Linkの対応表(LL.out_hs)とHGMDによる検索を用いて今年度は、27遺伝子、61文献、27タンパク質パスウェイについて収集を行い癌遺伝子の表(A)の作成を行った。前述の遺伝子についてLocus IDからNCBIのGenbankのRefSeqの対応表(loc2ref)の表によりRefSeq IDを抽出を行った。NCBI GenBankからRefSeq IDの検索を行い、cDNA及びタンパク質のアミノ酸配列を取り出し遺伝子ごとにcDNAとアミノ酸配列のファイル(B)の作成を行った。それと同時に項目として遺伝子記号、Refseq cDNA ID、Refseqアミノ酸配列ID、cDNA配列ファイル名、アミノ酸配列のファイル名の表(C)を作成した。この検索結果からハイデルベルグ大学のSMARTを用いてタンパク質の機能性ドメインの検索を行った。検索結果は、D1:遺伝子記号、ドメイン名、ドメインの始まりのアミノ酸番号、ドメインの終わりのアミノ酸番号、ドメイン予測、D2:遺伝子記号、D1で予測されなかったドメインの各項目、D1に反映されなかった理由の5項目、D3:遺伝子記号、D1、D2で予測されなかったドメインの各項目、ドメイン予測のスコアの5項目とした各遺伝子ごとのテキストファイルを作成を行った。さらに、ドメインの予測図の取り込みを行った。タンパク質パスウェイと関与する遺伝子、疾患の図の作製を行い、疾患に関しては日本語化を行った。表A, B, C, D1,D2,D3とSMARTのドメイン名の一覧についてMYSQLを用いてデータベース化を行った。さらにワークステーション上にWEBサーバーの作製を行い検索システムの構築を行った。
|