研究概要 |
本研究計画では,グラフや自然言語などの形で複雑な情報を記述する大規模な生命科学データが蓄積されつつあることを背景に,これらのデータを系統関係を考慮した生物種横断的な解析に用いるための基盤技術を開発することを目的としている.具体的には,(1)系統トポロジーの曖昧性を考慮した進化系統表現法の開発(2)複雑なグラフ構造をマルチスケールかっインタラクティブに解析するための手法開発(3)進化系統関係と論文情報とを用いた遺伝子-表現型関係の網羅的取得の3つのサブテーマに取り組んでいる.平成22年度の成果は以下のとおりである.(1)について,系統トポロジーの曖昧性を考慮しつつ,進化系統関係を偏りなく・直感的に・かっ効率的に描くための手法として開発した「車輪樹法」をさらに改良した,本手法はバイオインフォマティクス研究者のみならず進化系統学の専門家にも高く評価され,進化系統学分野の権威ある雑誌に採択された(Systematic Biology, 59, 584).また,RNAの二次構造予測やタンパク質のマルチプルアラインメントといった問題との数理的な類似性に着目し,より一般化した手法として拡張した(PLoS ONE, 6, e16450).(2)については,生命科学分野における巨大なグラフ・ネットワークデータを,超高速な階層的グラフクラスタリングアルゴリズムに基づいてウェブ上の地図サービスのように自由にズーム・平行移動できるソフトウェアの開発に成功した(Bioiniformatics, 27, 1121),サブテーマ(3)については,論文データベースに対して網羅的に高精度な固有表現認識を行い,遺伝子-表現型関係を網羅的に取得するための基盤となるデータベースを構築した,その過程で,論文管理と必読論文推薦を統合的に行うシステムTogoDocを開発した(PLoS ONE, 5, e15305).
|