• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2001 Fiscal Year Annual Research Report

文献からの生物知識の抽出と体系化

Research Project

Project/Area Number 12208001
Research InstitutionThe University of Tokyo

Principal Investigator

高木 利久  東京大学, 医科学研究所, 教授 (30110836)

Co-Investigator(Kenkyū-buntansha) 高井 貴子  東京大学, 大学院・情報理工学系研究科, 科学技術振興特任教員 (60222840)
辻井 潤一  東京大学, 大学院・情報理工学系研究科, 教授 (20026313)
Keywordsオントロジー / ゲノムデータベース / シグナル伝達系 / テキストからの情報抽出 / 自然言語処理
Research Abstract

ある分野から抽出された共通な認識を概念とよぶが、概念をサイエンスで利用するためには、背後に隠れている概念の性質や互いの関係を、明示的に定義することが必要である。この定義がオントロジーと呼ばれるものである。生物学においては、これまでモデル生物ごとに研究が行われてきたが、あいつぐモデル生物のゲノム配列決定から、今後は生物学における包括的なオントロジーの開発が求められている。また、生物知識の多くが依然として文献の中にテキストとして書かれていることから、テキストからの情報抽出などを行う計算機技術を開発することも重要な課題である。
このような動機のもとに研究を進め、平成13年度は以下の成果を得た。
・シグナルオントロジーをベースとし、ダイアグラムの複合グラフ表現と合体させた、シグナル伝達系データベースSPARK(Signal PAssing netwoRK database)の開発を行った。データの属性と型を定義するXML-DTDを作成し、XML-データベースサーバ、ダイアグラムを入出力するためのグラフ型インタフェース、オントロジーを入出力するためのツリー型インタフェースを開発した。
・シグナルオントロジーの概念空間を効率的に探索できる、専用のJAVAブラウザを開発し、このブラウザを介してオントロジーを公開した。シグナルオントロジーの対象概念の拡張については、生体化合物の分類、培養細胞の分類と組織名との関連付け、個体レベルの表現型や疾病の分類、を行った。
・並列表現や相互参照などの表現をマークアップするためのXML DTD (GPML)を定義した。MEDLINEアブストラクト2500件中に出現する専門用語にB1で定義したオントロジーに基づく意味タグを付与したタグ付きコーパスを作成し、うち670件を公開した。作成したコーパス上の専門用語の分類整理し、物質関連のほかに主要と思われるクラス(病名、実験手法名、生体反応名など)を洗い出し、B1で定義したオントロジーの範囲を拡張した。

  • Research Products

    (6 results)

All Other

All Publications (6 results)

  • [Publications] Mima, H.: "XML tag information management system. a workbench for ontology-based knowledge acquisition and integration"Proc. human Language Technology Conference. (to appear). (2002)

  • [Publications] Ohta, T.: "GENIA Corpus : an annotated research abstract corpus in molecular biology domain"Proc. Human Language Technology Conference. (to appear). (2002)

  • [Publications] Kim, J-D: "XML-based linguistic annotation of corpus"Proc. the First NLP and XML Workshop. 47-53 (2001)

  • [Publications] Fukuda, K: "Knowledge representation of signal transduction pathways"Bioinformatics. 17. 829-837 (2001)

  • [Publications] Ono, T.: "Automated extraction of information on protein interactions from the biological literature"Bioinformatics. 17. 155-161 (2001)

  • [Publications] Fukuda, K.: "Signal transduction pathways and logical inferences"METMBS2001. 297-303 (2001)

URL: 

Published: 2003-04-03   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi