2012 Fiscal Year Research-status Report
Project/Area Number |
24710215
|
Research Institution | Kyoto University |
Principal Investigator |
杉本 昌弘 京都大学, 医学(系)研究科(研究院), 講師 (30458963)
|
Project Period (FY) |
2012-04-01 – 2014-03-31
|
Keywords | メタボローム / データベース |
Research Abstract |
本研究の目的は、データの標準化(どのようなフォーマットでデータを保存し、共有し、再利用するか)を考慮したメタボロームのデータベースの開発を目的としている。メタボロームでは、トランスクリプトームのマイクロアレイデータと比較して、標準化が遅れており、プロファイルデータの保存と共有化(サンプル中の代謝物を網羅的に測定して、そのデータを保存・再利用する仕組み)が実現できていない。このため、実測データで得られた新たな知見が、対象とする生物、臓器、疾患などに特異的な現象かどうかを比較するなどが既存のデータを活用しにくい問題がある。 本年度は、まず既に論文で公開されているメタボロームの測定データをデータベースに格納するためのシステムの開発(データ構造の設計とプログラムの実装)を実施した。データとしてはCE-TOFMS(キャピラリー電気泳動・時間飛行型質量分析装置)からえられる情報を用い、濃度情報だけでなく、分析データの一部を抜き出したマススペクトルなどの情報もデータベースに登録・検索できる仕組みを作成した。同時に様々なメタボロームデータのIDへのリンクも取り込み、横断的にいろいろなデータベースに情報をアクセスしやすくするポータルサイトの機能の設計も行った。また、データの可視化ツールとして、代謝Pathwayに代謝物の濃度セットを与え、色で濃度を可視化し、同時にグラフも表示するツールを開発した。こちらは、最終的にはWeb上のツールとして統合する予定だが、まずはツールを開発した。特徴は、Pathwayを自由に簡便にカスタマイズできるよう、Pathwayを汎用的なソフトで作成し、図中の図形の配置から自動的に色を塗る位置を計算する仕組みにしたことである。 今後、CE-TOFMS以外の様々なデータに対応できるよう汎用化させるとともに、可視化ツールをWeb上に実装し、公開してゆく予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
要素技術の開発はおおよそ予定通り進んでいる。Web上には既に、試験的に開発したマウスの各臓器のCE-TOFMSデータを扱うデータベースMMMDB(http://mmmdb.iab.keio.ac.jp/)は公開しており、このシステムを基本として、プログラムの修正・追加を実施し、段階的に開発を行っている。ただし、本研究のゴールとするシステムは、特定のデータに特化しない汎用化したシステムにするため、Pathwayの可視化ツールやメタデータ(データの測定条件や、サンプル条件などの付属情報)の管理部分などが完成したら、新たに別のサイトとして公開する予定である。また、現段階では、Pathwayツールは単独アプリケーションとして作成したが、これは、測定データから、データ解析、データ可視化とパイプラインの中に組み込みやすい形式であり、また、編集が簡単なため、当初予定はしていなかったが、Webとは別ツールとしても機能する副産物としてリリースできる。データベースそのものは、マススペクトルのデータの容量がかなり大きく、データ検索時に大きな負荷がかかることが分かった。そこで、実際にデータの解釈に必要な、対象とするピークの近傍だけできちんとした測定データ(プロファイル形式)で残すか、全データから、個々のピーク形状の情報は落として、ピークの位置と大きさだけ(セントロイド形式)で落とすなど、比較して、データサイズの縮小化を行った。今後データベースに登録するデータが増加することを考慮して、これらのデータ構成を最適化したのちに、検索・閲覧画面などの周辺要素の開発も継続する。
|
Strategy for Future Research Activity |
今後の研究の推進方式として、まずは、これまでに開発してきた個々の要素をつなぎ合わせて、実際にWeb上にシステムを公開する。特に、データ構造のスキーマの開発は一通り終わっているが、データの中でとびぬけて容量の大きなマススペクトルのデータの最適化(正確には、必要な情報以外は省略する、適度な簡略化)を実施して、データベースの内容物として完成する。一方、単独のアプリケーションとして開発したPathway可視化ツールは、一般によく行われる2郡比較の統計情報なども併せて表示するような仕組みにしているが、より汎用的に多郡比較や時系列表示などにも対応し、可視化のオプションを追加する。さらに全体を主成分分析などでモデル化し、代謝物単独の比較だけでなく、測定データ全体の評価も行える機能を実装するなども試みる。これらはWebアプリケーションとして、データベースと連携するようにする。また、ポータルサイトとして機能させるために、他のデータベースとの連携に関して、頻繁に使われるメジャーなデータベースのIDはデータベースに取り組んだ。ただ、このID情報などは外部データデータでは更新されるために、更新部分を自動的に検知して、自己のデータベースに自動的に反映するWebロボット部分も開発を行う。さらに、測定データごとに付帯するサンプル情報の処理として、分析の視点での特徴(分析条件など)とサンプルの特徴(年齢、性別、疾患名など)を考慮する必要があり、主に分析条件に関しては既に完成している。今後は、サンプルの特徴部分を中心に検索の窓口と結果の表示機能も作成する。
|
Expenditure Plans for the Next FY Research Funding |
これまで、開発用のマシンとデータを試験的に動かすPCで個々の要素技術を開発してきたが、今後は実際に公開用のサーバーにデータを移し、実際にWebサイトの公開を行う。試験データを登録するとともに、Webロボットなども同時に動かして負荷試験を行う。Pathwayツールも結合して、正式バージョンのリリースとする。同時に公開されている測定データ+メタデータを複数セット登録して、横断的な検索などの試験を実施する。特に口腔がんやすい臓がん、あるいは健常者で生活習慣アンケートと同時に採取した唾液のメタボロームを最初の試験データとして登録する。これまでに、国際学会などでこれらデータベースの開発を発表してきたが、国内あるいは国際雑誌に論文の形式でも発表する。 本年度は、これら正式版のリリースのためのサーバーおよび、サーバーに関連したOS、UPS、ネットワーク機器、および研究成果を公表するための論文投稿費用などを使用する予定である。本来平成24年度にサーバー類は導入予定であったが、サーバーの環境構築よりも、プログラム開発に重点をおき、開発そのものは安価なPCで開発を行ってきたため、サーバーの導入を平成25年度に変更した。このため、直接経費に残額が生じている。
|
Research Products
(2 results)