研究課題/領域番号 |
17017002
|
研究機関 | 東京大学 |
研究代表者 |
高木 利久 東京大学, 大学院・新領域創成科学研究科, 教授 (30110836)
|
研究分担者 |
辻井 潤一 東京大学, 大学院・情報学環, 教授 (20026313)
中谷 明弘 東京大学, 大学院・新領域創成科学研究科, 助教授 (60301149)
|
キーワード | オントロジー / 機能解析 / パスウェイデータベース / テキストからの情報抽出 / 自然言語処理 / QTL解析 / 知識発見 / 文献クラスタリング |
研究概要 |
生命をシステムとして理解するためには、ゲノム配列やタンパク質立体構造だけでなく、発現、局在、相互作用、パスウェイ、ネットワーク、表現型、および、それらの間の関係や生物学的な制約や文脈などに関する知識などを計算機上に統合し、その性質、特徴、振る舞いなどを解析することが不可欠である。そこで本研究では、(a)表現型情報と種々のゲノム情報の統合および知識発見技術の開発によるシステムの構造解明、(b)医学・生物学文献からの概念およびその関係性の抽出技術と利用技術の開発、(c)複雑な生物知識の表現法および推論法の開発、の3つのテーマについて研究を展開した。 平成17年度のおもな成果は以下の通りである。 (a)遺伝子と表現型を結び付けるQTL解析について研究を展開した。具体的には二次元区間マッピング法(2DIM)および2DIMによるQTL交互作用ネットワークの作成法を開発し、統合失調症モデルマウスへ適用した。 (b)従来の遺伝子名辞書、ファミリ名辞書などの整備に加え、化合物、疾患名などの名称を、用語のスペルや局所文脈の特徴をベースに統計処理および機械学習を用いて自動的に収集した。また、これまでに開発した情報抽出システムにより取り出した概念間の関係性を複数組み合わせて、概念間の明示的/潜在的な関係性を取り出し可視化するシステムを開発した。このシステムはアレイデータなどの大量実験データの半自動的解釈を可能とする。これらの研究と並行して、英文解析システムEnju(分担者の辻井研で開発)を用いた情報抽出システムの開発も行った。 (c)上記(a)で作成したQTL交互作用ネットワークのデータベース内にある、互いに関連することが予想される量的形質に関するネットワーク間の比較・重ね合わせ・相互補完をするツール群を作成した。また、これらの処理結果を視覚化するプログラムも開発した。
|