2006 Fiscal Year Annual Research Report
知識処理技術を用いた生命システムの再構築とその解析
Project/Area Number |
17017002
|
Research Institution | The University of Tokyo |
Principal Investigator |
高木 利久 東京大学, 大学院新領域創成科学研究科, 教授 (30110836)
|
Co-Investigator(Kenkyū-buntansha) |
辻井 潤一 東京大学, 大学院情報理工学系研究科, 教授 (20026313)
中谷 明弘 東京大学, 大学院新領域創成科学研究科, 助教授 (60301149)
|
Keywords | オントロジー / 機能解析 / パスウエイデータベース / テキストからの情報抽出 / 自然言語処理 / QTL解析 / 知識発見 / 文献クラスタリング |
Research Abstract |
生命をシステムとして理解するために、本研究では次の3つのテーマについて研究を展開した。 (a)表現型情報と種々のゲノム情報の統合および知識発見技術の開発によるシステムの構造解明、(b)医学・生物学文献からの概念およびその関係性の抽出技術と利用技術の開発、(c)複雑な生物知識の表現法および推論法の開発 平成18年度のおもな成果は以下の通りである。 (a)文献から抽出した図表の閲覧システムを構築し、人手によって約250報、1900件余の図表データの収集を行った。さらにFlybaseの持つ統制語彙を母体として図表データに対する遺伝子型・表現型のアノテーション環境を構築した。破壊株表現型プロファイル解析に関しては、遺伝子破壊による表現型値のプロファイルをクラスタリンングするシステムを開発した。QTL解析に関しては、二次元化した区間マッピングを行うシステムの開発を継続した。 (b)疾患名やパスウエイ名辞書の整備とともに、遺伝子-疾患情報の情報抽出技術を開発した。以前より開発中の知識発見支援システムに会話的に実験解釈を行える機能を強化した。また、パスウェイ図の自動分類技術の開発および原核生物の遺伝子名称の辞書を構築し、メタゲノムをターゲットとした文献ベースのアノテーションシステムのプロトタイプを作成した。また、文献のクラスタリング、ラベリング、センテンス抽出機能の実装およびウェブサービスの公開を行った。あわせて生物学者による評価を行い、有用性を確認した。 (c)利用者が指定した質問・探索条件に基づいて、蛋白質問相互作用などからパスウエイ情報を複数の種について抽出するシステムを構築した。また、複数の遺伝子ネットワークで共通した部分構造の抽出手法、アミノ酸配列類似性情報からオーソロジー情報を抽出する手法の開発を行った。
|