研究課題/領域番号 |
26330342
|
研究機関 | 東京工科大学 |
研究代表者 |
村上 勝彦 東京工科大学, 応用生物学部, 准教授 (30344055)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 多重検定 / 遺伝子機能 / 疾患 / タンパク質間相互作用 / 立体構造 / 細胞内局在 |
研究実績の概要 |
目的:ENCODE計画、ヒトゲノム多型、蛋白質相互作用のデータが膨大に測定され、これらの関連を解明する深い解析が待たれている。本研究では、異なるデータベースから関連しそうな情報の相関を解析し、データ説明のための潜在的因子を新たに定義する。本年度はデータ取得・精製と単純相関の検定に焦点を絞り、研究を行った。 ヒト遺伝情報関連の主要データベース群から、ゲノム配列に基づくデータ、転写物、タンパク質について、また疾患、蛋白質間相互作用、立体構造、蛋白機能ドメイン、細胞内局在等の情報を収集した。自由記述のデータからもヒト遺伝子、蛋白質に関するテキスト文情報を取得した。 予定したデータは取得・修正をし終わり、そのデータからターム間の相関を網羅的に計算するプログラムを開発している。データの精製には細かい課題が残っているが、疾患、蛋白質間相互作用、立体構造、蛋白機能ドメイン、細胞内局在等の情報においては計算を完了し、99,747個の(有意に相関がある)タームペアが発見され、学会にて発表した(生命医薬情報学連合大会)。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
ヒト遺伝情報関連の主要データベース群のうち計画していたもの全部からデータを収集することができた。ゲノム配列に基づくデータ(UCSCゲノムブラウザーからENCODE領域のヒストンメチル化・アセチル化、プロモーター、エンハンサーの推定活性指標等)を取得し、Mouse Genome Database (MGD)からマウス特有のアノテーション、UniProt、RefSeq、H-InvDBから人に関する疾患、蛋白質間相互作用、立体構造、蛋白機能ドメイン、細胞内局在等の情報を収集した。 またWikipediaからヒト遺伝子、蛋白質に関するテキスト文情報を取得した。データの中から遺伝子に関する記述をうまく絞り込んで取り出すのが困難であったが、ノイズを取り除く処理はアドホックな方法によって対応した。 取得できたデータから、ターム間の相関を網羅的に計算するプログラムを開発している。疾患、蛋白質間相互作用、立体構造、蛋白機能ドメイン、細胞内局在等の情報においては計算を完了し、数百の有意に相関があるタームが発見され、学会にて発表した(第3回生命医薬情報学連合大会)。 比較的大規模な計算をするためのサーバーについて、大型計算機とクラウド計算資源のどちらを準備するか比較検討した。手間などは別にして必要な予算に関して検討した結果であるが、現時点では、小規模な計算や実験については安価なワークステーションで断続的に計算をして、大規模な場合にのみクラウドで計算をするのがよいという試算結果である。しかし、今後の状況が変化する可能性もあり、試算結果は状況に依存するものであるため、予断を許すものではない。 以上、ほぼ予定どおりの結果を得ることが出来たので、研究は順調に進展している。
|
今後の研究の推進方策 |
今後はデータの精製をすすめる。同義語、異義語の問題は自由記述のテキストデータだけではなく、オントロジーのあるものについても再検討が必要である。 また新規のデータ収集および更新を行う。各年度の上期に、新たなデータを検討して追加したり、データ更新があれば更新・再計算を行い、ほぼ自動更新できるようなシステムにする。 得られた相関データを用いたGSEA解析の開発を開始する。GSEAとは、解析したい遺伝子セットが与えられたとき、多くの遺伝子に関連するアノテーション(概念)のリストを定量的なスコアと共に示すものである。本研究では、これまでに得られた相関ルールとアノテーションの関連性を考慮し、ベイズネットの枠組みを用いた「関連情報を与えたときの、あるアノテーションの確からしさ」の推定方法を検討する。 つぎに巨視的相関構造の抽出を開始する。すでに得た微視的構造をもとに相互情報量など複数の係数から巨視的構造を求める。
|
次年度使用額が生じた理由 |
年度途中で所属が変更になったため、プログラム開発を外注する適当な期間がとれなかった。
|
次年度使用額の使用計画 |
様々なアノテーション相関の計算を、より大規模に展開するためのプログラム開発の実施に使用する(60万円)。 また、学会発表の費用として、国内の学会(生命医薬情報連合大会(10月)、国際会議バイオハッカソン(3月)、日本分子生物学会(12月)等)に合計30万円。海外の学会(国際会議)はPSB (Pacific Symposium on Biocomputing). Global Conference on Consumer Electronics(ベトナム) 49万円を予定している。 さらに、論文の投稿費用として20万円使用する予定である。
|