• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2003 年度 実績報告書

文献からの生物知識の抽出と体系化

研究課題

研究課題/領域番号 12208001
研究機関東京大学

研究代表者

高木 利久  東京大学, 大学院・新領域創成科学研究科, 教授 (30110836)

研究分担者 福田 賢一郎  産業技術総合研究所, 生命情報科学研究センター, 研究員 (10357890)
高井 貴子  東京大学, 大学院・情報理工学系研究科, 科学技術振興特任教員 (60222840)
辻井 潤一  東京大学, 大学院・情報学環, 教授 (20026313)
キーワードオントロジー / ゲノムデータベース / シグナル伝達系 / テキストからの情報抽出 / 自然言語処理 / タグ付きコーパス / 遺伝子辞書 / パスウェイデータベース
研究概要

生命機能を計算機でうまく扱えるようにすることを目標に、文献に書かれた知識をいかに自動的に抽出するか、それをいかに計算機の中に表現し利用するかという観点から以下の課題に取り組んでいる。
a)文献(テキスト)からパスウェイや相互作用に関する知識を自動的に抽出するためのシステムの開発
b)上記a)のために必要なコーパス、オントロジーやタンパク質辞書などの整備
c)シグナル伝達を対象としたパスウェイやオントロジーの表現方法、利用方法の開発
上記それぞれについて以下の成果が得られた。
a)蛋白質-蛋白質、DNA,化合物間の相互作用および蛋白質の機能を、自動抽出するシステムを開発した。これによる抽出結果はPRIME DBから検索、描画可能である。なお、HPSGを利用した構文解析で得られる述語・項の関係は、分子間相互作用などのイベント抽出のテンプレートとして利用することができる。従来非常に長い計算時間を要していたこのHPSGパージングを高速化する手法を開発し、実用的な情報抽出への適用を可能にした。
b)主な真核生物の遺伝子名の辞書GENAとファミリー名辞書を構築した。GENAは各種DBの情報や自動抽出したアブスト中の頭字語などから半自動的に構築している。また、ファミリー名辞書は文献中の暖昧な遺伝子表記を処理するためのものであり、配列情報とアブスト中の名称から半自動的に構築している。この他に、昨年度までに作成・公開したタグ付コーパスのエラー修正を行い、さらに相互参照情報や係り受け情報を付与した。
c)分子反応の線形結合として表現されたシグナル伝達パスウェイから、生物機能という意味を推論する方法の開発を目的として、分子反応を「情報を伝達する」という意味に基づいて解釈するための規約を与えるオントロジーを開発した。その結果、分子反応と生物機能を組織的に関係付けることが可能となった。

  • 研究成果

    (7件)

すべて その他

すべて 文献書誌 (7件)

  • [文献書誌] Terai, G.: "Predicting rules on organization of cis-regulatory elements, taking the order of elements into account"Bioinformatics. (印刷中). (2004)

  • [文献書誌] Koike, A.: "Kinase Pathway Database : An integrated protein-kinase and NLP-based protein-interaction resource"Genome Research. 13. 1231-1243 (2003)

  • [文献書誌] Tsuruoka, Y.: "Boosting Precision and Recall of Dictionary-Based Protein Name Recognition"Proceedings of the ACL -03 Workshop on Natural Language Processing in Biomedicine. 41-48 (2003)

  • [文献書誌] Tsuruoka, Y.: "Probabilistic Term Variant Generator for Biomedical Terms"Proceedings of the 26th Annual International ACM SIGIR Conference. 167-173 (2003)

  • [文献書誌] Takai-Igarashi, T.: "Cell Signaling Networks Ontology"In Silico Biology. 4. 0008 (2003)

  • [文献書誌] Fukuda, K.: "FREX : a query interface for biological processes with a hierarchical and recursive structures"In Silico Biology. 4. 0007 (2003)

  • [文献書誌] 美宅成樹, 榊佳之 編: "応用生命科学シリーズ9 バイオインフォマティクス"東京化学同人. 195 (2003)

URL: 

公開日: 2005-04-18   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi