2011 Fiscal Year Research-status Report
オーミクス実験データ解釈におけるボトルネックの解消
Project/Area Number |
23710231
|
Research Institution | The University of Tokyo |
Principal Investigator |
岩崎 渉 東京大学, 大気海洋研究所, 講師 (50545019)
|
Project Period (FY) |
2011-04-28 – 2015-03-31
|
Keywords | バイオインフォマティクス / データベース / ゲノム / ネットワーク / データ解釈 / データ可視化 / テキストマイニング / オーミクス |
Research Abstract |
爆発的なペースでオーミクス実験データが蓄積し続ける中、研究者がそれらのデータを論文や様々なデータベースの内容に照らし合わせつつ仮説を構築するステップが生命科学研究における深刻なボトルネックとなっている。この「解釈」に関して現在事実上の標準となっている手法としては,Gene Ontology中で統計学的に有意に関連するタームを発見するものがよく用いられている。しかし、Gene Ontologyで表現できる情報はごく限られたものであり、「すでによく知られた知識のオーミクスデータによる確認」を超えて新たな知識を得る上で限界があることが問題となっている。本研究では、論文データベースおよび近年様々なプロジェクトで整備されてきたデータベース群のデータをネットワークの形式で表現することで、膨大なオーミクス実験データの解釈を支援するための情報技術開発を行っている。平成23年度は、英文中からの遺伝子名の抽出(固有表現認識)に関して、複数生物種の遺伝子名辞書・遺伝子ID辞書への対応ができるよう既存手法の改良を行い、複数の生物種の遺伝子がしばしば同一文献に現れる一般の医学生物学文献を解析できるシステムを開発した。さらに、改良した手法を実装し、医学生物学分野の文献データベースPubMedに含まれる1000万件を超える英文アブストラクトに対して適用し、網羅的に遺伝子名の抽出および遺伝子IDとの対応付けを行った。これにより、オーミクスデータを文献データベースと網羅的に対応づけ、オーミクスデータの解釈を加速するための基盤が整った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
おおむね順調に進行しているが、東日本大震災およびそれに伴う解析サーバの停電があったため、研究の遂行がやや遅れた。
|
Strategy for Future Research Activity |
平成23年度は東日本大震災およびそれに伴う解析サーバ停電のため研究の遂行がやや遅れた。そこで、平成24年度は平成23年度に達成できなかった点から順に研究を推進する。
|
Expenditure Plans for the Next FY Research Funding |
平成23年度は東日本大震災およびそれに伴う解析サーバ停電のため研究の遂行がやや遅れた。そこで、平成24年度は平成23年度に達成できなかった点から順に研究を推進する。
|