研究課題
爆発的なペースでオーミクス実験データが蓄積し続ける中、研究者がそれらのデータを論文や様々なデータベースの内容に照らし合わせつつ仮説を構築するステップが生命科学研究における深刻なボトルネックとなっている。この「解釈」に関して現在事実上の標準となっている手法としては,Gene Ontology中で統計学的に有意に関連するタームを発見するものがよく用いられている。しかし、Gene Ontologyで表現できる情報はごく限られたものであり、「すでによく知られた知識のオーミクスデータによる確認」を超えて新たな知識を得る上で限界があることが問題となっている。本研究では、論文データベースおよび近年様々なプロジェクトで整備されてきたデータベース群のデータをネットワークの形式で表現することで、膨大なオーミクス実験データの解釈を支援するための情報技術開発を行っている。平成25年度は、平成24年度までに作成した医学生物学分野の文献データベースPubMedから遺伝子名およびキーフレーズを抽出したデータベースを用い、ユーザーが興味を持つ医学生物学概念および遺伝子名セットのクエリに応じて関連キーフレーズをネットワーク形式で抽出する機能を実装した。これにより、オーミクスデータを文献データベースと網羅的に対応づけオーミクスデータの解釈を加速するシステムの基盤が構築できた。
2: おおむね順調に進展している
平成23年度に東日本大震災およびそれに伴う解析サーバの停電があったため研究の遂行がやや遅れたが、順調に遅れを取り戻しつつある。
このまま当初計画通りに研究を推進する。
研究代表者の異動に伴い、年度をまたぐ研究に関して計算機購入や研究発表旅費にかかる繰り越しが生じた。平成26年度に順次執行する。
すべて 2014 2013 その他
すべて 雑誌論文 (8件) (うち査読あり 8件、 オープンアクセス 4件、 謝辞記載あり 4件) 学会発表 (32件) (うち招待講演 7件) 備考 (1件)
Genome Biology
巻: 15 ページ: R16
10.1186/gb-2014-15-1-r16
PLOS ONE
巻: 9 ページ: e87126
10.1371/journal.pone.0087126
Journal of Biomedical Semantics
巻: 5 ページ: 5
10.1186/2041-1480-5-5
Molecular and Cellular Biology
巻: 34 ページ: 1776-1787
10.1128/MCB.01465-13
Proc Natl Acad Sci U S A
巻: 111 ページ: 6732-6737
10.1073/pnas.1403051111
巻: 8 ページ: e73535
10.1371/journal.pone.0073535
Molecular Biology and Evolution
巻: 30 ページ: 2531-2540
10.1093/molbev/mst141
巻: 30 ページ: 2494-2508
10.1093/molbev/mst153
http://www.aori.u-tokyo.ac.jp/research/news/2014/20140408.html