2001 Fiscal Year Annual Research Report
Project/Area Number |
12208007
|
Research Institution | Kyoto University |
Principal Investigator |
五斗 進 京都大学, 化学研究所, 助教授 (40263149)
|
Co-Investigator(Kenkyū-buntansha) |
佐藤 賢二 北陸先端科学技術大学院大学, 知識科学研究科, 助教授 (10215783)
|
Keywords | 分子間相互作用 / アミノ酸配列類似度データ / 酵素反応 / リンク情報 / 相関ルール発見手法 / ゲノムデータベース / オントロジー / 知識抽出 |
Research Abstract |
(1)分子間の関連情報データベースBRITEの構築 分子間相互作用データに代表される分子間の関連情報を付加情報とともに従来の分子生物学データベースと統合できる形でデータベース化するために、分子間の様々な関連を二項関係として表現しデータベース化している。本年度は、遺伝子間の関連を表すデータとして、分子間相互作用データ以外に、全ゲノムが決定された生物種の全遺伝子間のアミノ酸配列類似度を網羅的に計算した結果を蓄えたデータベースSSDBや、化合物情報を追加する意味で、化学反応データを化合物の二項関係として表現したデータを含むLIGANDの構築に力を入れてきた。SSDBとLIGANDはそれぞれ、http://ssdb.genome.ad.jp/とhttp://www.genome.ad.jp/ligandとして公開している。いずれも、BRITE(Biomolecular Relations in Information Transmission and Expression)のホームページhttp://www.genome.ag.jp/brite/からもアクセスできる。 従来の分子生物学データベースから抽出したリンク情報はLinkDBとして構築してきたが、これをBRITEと統合的に扱えるように拡張している。また、ネットワーク計算と比較を行うためのインタフェースを構築し、これは現在も改良中である。 (2)データ間の関連をデータベースから抽出するシステムの開発 データ間の関連を抽出するために、代表的なデータマイニング手法である相関ルール発見手法を用いて、与えられたエントリ集合に共通かつ特有な性質を高速に発見する汎用的な枠組みを考案し、実現している。これまで、LinkDBのリンク情報を利用して、そこから共通性質の抽出を行うようにしていたが、本年度は、外延的オントロジーの構築によるキーワード間の関連付けを試みた。具体的にはGenomeNetでサービス中の22のデータベースから専門用語を切り出し、簡単な階層化と専門用語認識ツールを作成した。現在、約160万語のキーワードが抽出されており、これらを整理し関連付けた結果を用いて、エントリ集合の共通性質の抽出に適用できるようにした。
|
-
[Publications] Goto, S., +4: "LIGAND : database of chemical compounds and reactions in biological pathways"Nucleic Acids Research. 30. 402-404 (2002)
-
[Publications] Kanehisa, M., Goto, S., Kawashima, S., Nakaya, A.: "The KEGG database at GenomeNet"Nucleic Acids Research. 30. 42-46 (2002)
-
[Publications] Nakay, A., Goto, S., Kanehisa, M.: "Extraction of correlated gene clusters by multiple graph comparison"Genome Informatics. 12. 44-53 (2001)
-
[Publications] Satou, K., Fuseda, Y., Konagaya, A., Takagi, T.: "A framework for quick-and-pinpoint data mlning and its application to heterogeneous genome databases"Knowledge-Based Intelligent Information Engineering Systems & Allied Technologies (KES2001). 1. 773-777 (2001)
-
[Publications] Kuroda, M., +35: "Whole genome sequencing of meticillin-resistant Staphylococcus aureus"Lancet. 357. 1225-1240 (2001)
-
[Publications] Sato, Y., +5: "SSDB : sequence similarity database in KEGG"Genome Informatics. 12. 230-231 (2002)