研究課題/領域番号 |
15K07214
|
研究機関 | 東京工業大学 |
研究代表者 |
森 宙史 東京工業大学, 生命理工学研究科, 助教 (40610837)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | メタゲノム / データベース |
研究実績の概要 |
収斂現象が観察される細菌群集の特徴を明らかにするために、公共の塩基配列データベース中に存在するメタ16S・メタゲノムサンプルの配列データと付随するメタデータを、キーワード検索を基にして網羅的に取得した。しかしながら、それらのデータはメタデータからのメタ16Sデータとメタゲノムデータの判別が困難であったため、サンプルごとにメタ16Sデータなのかメタゲノムデータなのかを配列の多様性を基に自動で判別するプログラムを開発した。 上記の自動判別プログラムの他に配列のクオリティフィルタリングプログラムや、メタ16Sとメタゲノムの区別無くGPUを用いてサンプルの系統組成を16S rRNA遺伝子配列から高速に計算するプログラム、遺伝子予測後に既知の機能遺伝子配列データベースに対して配列類似性検索を行うことで遺伝子機能組成を推定するプログラム等を開発した。それらのプログラムを用いて、スーパーコンピュータを用いて全サンプルに対して計算を実行し、全サンプルの系統組成と、多くのサンプルの遺伝子機能組成データを得ることが出来た。一部のサンプルの遺伝子機能組成データを得るための計算は未だ実行中ではあるが、2016年度の初旬には完了する予定である。これらのデータは、本研究の目的を達成する上で必須となる基盤データである。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
当初はメタゲノムサンプルごとの系統組成および遺伝子機能組成の推定用の計算は1年目で終わらせる予定であったが、メタ16Sとメタゲノムあわせて約15万件と、予想よりもデータの数がかなり多くなっていたため、遺伝子機能組成推定のための計算が1年目では終わらなかったため、やや遅れているとした。 しかしながら、2年目の初旬でこの計算は完了する見込みである。
|
今後の研究の推進方策 |
得られたメタゲノムサンプルごとの系統組成および遺伝子機能組成データと、それらのサンプルのメタデータを半自動的に整理して生息環境の抽出およびアノテーション付けを行い、本研究で解析に用いる基盤データの完成を急ぐ。 データが大量になっているので、系統組成および遺伝子機能組成データをサンプル間で比較解析する際には、全サンプルを一度に比較解析に用いるのではなく、サンプルごとに統計量を計算して詳細に比較解析すべきサンプル群を絞り込むことで、解析の効率化を行う。
|
次年度使用額が生じた理由 |
メタゲノムの遺伝子機能組成の計算が完了しなかったため、予定していた国際学会での発表2件への応募をとりやめたことによって、次年度使用額が生じた。
|
次年度使用額の使用計画 |
今年度にはメタゲノムの遺伝子機能組成の計算は完了するので、今年度末近くに開催される国際学会2件での発表を計画しており、その旅費として使用したい。
|