研究概要 |
疾患遺伝子変異・多型総合知識ベースの構築を計画通り進めており、本年度は以下の成果を得た。 A.疾患遺伝子変異データの収集 遺伝子疾患変異知識ベースKMDBのデータ構築が順調に進んでおり、現在までに190疾患、200遺伝子、突然変異件数6707件を1497の文献から抽出して入力した。 B.多型データの抽出 上記の200遺伝子に関しては、同時に多型データも文献から収集しており、合計1469件の入力を完了している。カロリンスカのHGBASEのデータ(2001年11月2日版)を解析した結果、全984,093件の多型データのうち、明瞭な遺伝子の記載のあるものは16,919件(4151遺伝子)しか含まれていなかった。そのうち、上記200遺伝子に関する多型は抽出してKMDBに収載した。以上A,Bで収集したデータはhttp://www.dmb.med.keio.ac.jpで公開している。現在、合計300遺伝子の知識ベース化を目指して、さらに最低100種の遺伝子の変異データを収集・抽出・入力している。 C.知識ベース化の基本検討 HLA遺伝子クラスターのGenBank/EMBL/DDBJエントリーをダウンロードし、記載してあるゲノム塩基配列、CDS、多型などの情報を自動的に抽出して知識ベース化する方法を検討し、プロトタイプを作成した。そのデータをモデルとして、ゲノム上で連続する複数の遺伝子領域のエキソン/イントロン構造や、疾患変異、多型などを同時に表示するアプレットも試作した。 KMDBは、昨秋創設されたHGVS(Human Genome Variation Society)の公式サイト(http://ariel.ucs.unimelb.edu.au:80/〜cotton/mdi.htm)からリンクされている。
|