2008 Fiscal Year Annual Research Report
知識処理技術を用いた生命システムの再構築とその解析
Project/Area Number |
17017002
|
Research Institution | The University of Tokyo |
Principal Investigator |
高木 利久 The University of Tokyo, 大学院・新領域創成科学研究科, 教授 (30110836)
|
Co-Investigator(Kenkyū-buntansha) |
中谷 明弘 東京大学, 大学院・新領域創成科学研究科, 准教授 (60301149)
|
Keywords | オントロジー / 機能解析 / パスウェイデータベース / テキストからの情報抽出 / 自然言語処理 / QTL解析 / 知識発見 / 文献クラスタリング |
Research Abstract |
生命をシステムとして理解するために、(a)表現型情報と種々のゲノム情報の統合および知識発見技術の開発による生命システムの構造解明、(b)医学・生物学文献から知識やその根拠となった実験事実などを抽出し利用する技術の開発、(c)複雑な生物知識の表現法およびそれらの比較解析や検索のための手法の開発、の3つのテーマについて研究を展開した。平成20年度のおもな成果は以下の通りである。 (a) メダカの顔貌形質に関係する量的形質遺伝子座解析に向けて、収集されている複数の近交系の頭部の画像データ(新屋班員・遺伝研)をデータベース化した。また、各近交系の特徴を、単独の「合成形質」として数値化し、その合成形質のマッピングを試みた。その結果、顎付近の比較的少数(3〜5程度)の要素形質の加重線形和による近交系集団の効率良い分離と、それに関連する候補遺伝子座が確認できた。 (b) 論文誌JBCおよびCellについて5年分のフルペーパーを取得し、細胞名、実験手法、蛋白質・遺伝子名を抽出した。これをいくつかの生物学的現象や概念について整理し、実験環境や実験手法にどの程度のばらつきがあるか調査した。また、フルペーパー中の図をテキスト情報と同様に検索できるように、特徴点・勾配ベースの特徴量を図から抽出した後、クラスタリング・量子化した値を用いて分類を行う方法を開発し、76%の分類性能を達成した。 (c) 類似ネットワークの検索について、クラスタリング等の工夫を行うことでユーザに提示する情報量を削減する機能を追加した。また、160種の原核生物ゲノムデータを用いて、代謝パスウェイの進化過程の網羅的な再構築・解析を行った。その結果、初期のパスウェイ獲得は異なる系統群間で同時代的に起こったことが示唆された。この結果をもとに、パスウェイの進化が原核生物コミュニティ内での双方向的な遺伝子水平伝播により促進されるという新たな進化モデルを提案した。
|
Research Products
(8 results)