2003 Fiscal Year Annual Research Report
Project/Area Number |
12208001
|
Research Institution | The University of Tokyo |
Principal Investigator |
高木 利久 東京大学, 大学院・新領域創成科学研究科, 教授 (30110836)
|
Co-Investigator(Kenkyū-buntansha) |
福田 賢一郎 産業技術総合研究所, 生命情報科学研究センター, 研究員 (10357890)
高井 貴子 東京大学, 大学院・情報理工学系研究科, 科学技術振興特任教員 (60222840)
辻井 潤一 東京大学, 大学院・情報学環, 教授 (20026313)
|
Keywords | オントロジー / ゲノムデータベース / シグナル伝達系 / テキストからの情報抽出 / 自然言語処理 / タグ付きコーパス / 遺伝子辞書 / パスウェイデータベース |
Research Abstract |
生命機能を計算機でうまく扱えるようにすることを目標に、文献に書かれた知識をいかに自動的に抽出するか、それをいかに計算機の中に表現し利用するかという観点から以下の課題に取り組んでいる。 a)文献(テキスト)からパスウェイや相互作用に関する知識を自動的に抽出するためのシステムの開発 b)上記a)のために必要なコーパス、オントロジーやタンパク質辞書などの整備 c)シグナル伝達を対象としたパスウェイやオントロジーの表現方法、利用方法の開発 上記それぞれについて以下の成果が得られた。 a)蛋白質-蛋白質、DNA,化合物間の相互作用および蛋白質の機能を、自動抽出するシステムを開発した。これによる抽出結果はPRIME DBから検索、描画可能である。なお、HPSGを利用した構文解析で得られる述語・項の関係は、分子間相互作用などのイベント抽出のテンプレートとして利用することができる。従来非常に長い計算時間を要していたこのHPSGパージングを高速化する手法を開発し、実用的な情報抽出への適用を可能にした。 b)主な真核生物の遺伝子名の辞書GENAとファミリー名辞書を構築した。GENAは各種DBの情報や自動抽出したアブスト中の頭字語などから半自動的に構築している。また、ファミリー名辞書は文献中の暖昧な遺伝子表記を処理するためのものであり、配列情報とアブスト中の名称から半自動的に構築している。この他に、昨年度までに作成・公開したタグ付コーパスのエラー修正を行い、さらに相互参照情報や係り受け情報を付与した。 c)分子反応の線形結合として表現されたシグナル伝達パスウェイから、生物機能という意味を推論する方法の開発を目的として、分子反応を「情報を伝達する」という意味に基づいて解釈するための規約を与えるオントロジーを開発した。その結果、分子反応と生物機能を組織的に関係付けることが可能となった。
|
Research Products
(7 results)
-
[Publications] Terai, G.: "Predicting rules on organization of cis-regulatory elements, taking the order of elements into account"Bioinformatics. (印刷中). (2004)
-
[Publications] Koike, A.: "Kinase Pathway Database : An integrated protein-kinase and NLP-based protein-interaction resource"Genome Research. 13. 1231-1243 (2003)
-
[Publications] Tsuruoka, Y.: "Boosting Precision and Recall of Dictionary-Based Protein Name Recognition"Proceedings of the ACL -03 Workshop on Natural Language Processing in Biomedicine. 41-48 (2003)
-
[Publications] Tsuruoka, Y.: "Probabilistic Term Variant Generator for Biomedical Terms"Proceedings of the 26th Annual International ACM SIGIR Conference. 167-173 (2003)
-
[Publications] Takai-Igarashi, T.: "Cell Signaling Networks Ontology"In Silico Biology. 4. 0008 (2003)
-
[Publications] Fukuda, K.: "FREX : a query interface for biological processes with a hierarchical and recursive structures"In Silico Biology. 4. 0007 (2003)
-
[Publications] 美宅成樹, 榊佳之 編: "応用生命科学シリーズ9 バイオインフォマティクス"東京化学同人. 195 (2003)