2002 Fiscal Year Annual Research Report
Project/Area Number |
12208001
|
Research Institution | The University of Tokyo |
Principal Investigator |
高木 利久 東京大学, 医科学研究所, 教授 (30110836)
|
Co-Investigator(Kenkyū-buntansha) |
福田 賢一郎 産業技術総合研究所, 生命情報科学研究センター, 研究員 (10357890)
高井 貴子 東京大学, 大学院・情報理工学系研究科, 科学技術振興特任教員 (60222840)
辻井 潤一 東京大学, 大学院・情報理工学系研究科, 教授 (20026313)
|
Keywords | オントロジー / ゲノムデータベース / シグナル伝達系 / テキストからの情報抽出 / 自然言語処理 / キナーゼデータベース |
Research Abstract |
ゲノム配列データや遺伝子発現データの生物学的/医学的意味付けをする上でも、また、生命を統合的に理解する上でも、生命機能に関する生物学的/医学的知識を集めた包括的なデータベースが不可欠であることが近年明らかになってきた。生命機能は、言葉で表現される場合と、遺伝子やタンパク質の相互作用のパスウェイやネットワークとして表現される場合とがある。上記のデータベースを構築するにはこの二つの側面から機能にアプローチする必要がある。 前者に関しては、論文(テキスト)からいかにして生命機能に関する知識を抽出するかという問題に取り組み、まず、そのためのリソース具体的にはタグ付コーパス(MEDLINEアブストラクト 2,000件に出現する専門用語に品詞情報等の意味タグを付与した構造化テキスト)を作成し公開した。次にこのコーパスを利用して、専門用語を自動認識するシステムの精度を改良した。また、コーパス中で意味タグを付与された専門用語を解析・整理することにより、これまで開発してきたGENIAオントロジーの下位概念を拡張し、より豊かなものにした。また、これと並行して知識の自動抽出にも取り組んだ。これまでに開発してきたフル・パーザーを用いた効率の良い構文解析手法を組み合わせ、生命機能に関する知識に関する表現を自動認識するための実証実験を行った。 後者のパスウェイに関しては、昨年度までに開発したパスウェイ表現の枠組みを用いて、文献からシグナル伝達パスウェイの情報を収集しデータベースに格納した。また、それを検索するためのグラフィカル利用者インタフェースを開発した。これと並行して昨年度までに開発したキナーゼデータベースの機能拡張を行った。また、そのための相互作用情報の文献からの自動抽出システムを開発した。
|
Research Products
(7 results)
-
[Publications] Poluliakh, N.: "Melina : a web server for motif extraction from promoter regions of potentially co-regulated genes"Bioinformatics. 19(3). 423-424 (2003)
-
[Publications] Yada, T.: "DIGIT : a novel gene finding program by combining gene-finders"Proc. Pacific Symnpo. on Biocomnputing '03. 8. 375-387 (2003)
-
[Publications] Koike, A.: "The evolution and functional conservation of eukaryotic kinase domains among organisms"Genomne Lett.. 1(2). 83-104 (2002)
-
[Publications] Hirakawa, M.: "JSNP : a database of common gene variations in the Japanese population"Nucleic Acids Res.. 30. 158-162 (2002)
-
[Publications] Kazama, J.: "Tuning support vector machines for biomedical named entity recognition"In the Proceedings of the Natural Language Processing in the Biomedical Domain (ACL 2002). 1-8 (2002)
-
[Publications] Nenadic, G.: "Terminology-driven literature mining and knowledge acquisition in biomedicine"In the Special Issue of the International Journal of Medical Informatics on Natural Language Processing in Biomedical Applications (NLPBA2002). 67. 33-48 (2002)
-
[Publications] 佐藤 賢二: "応用生命科学シリーズ(9)バイオインフォマティクス(分担執筆)"東京化学同人. 190 (2003)