研究課題
本年度は、複雑なオミックスデータ情報を柔軟に統合・圧縮し、複雑系疾病の解明に有用な特徴量を抽出するための、新規方法論の開発とアルゴリズムの実装を進めた。具体的には、JAVA言語をベースとした多階層テンソル因子分解アルゴリズムの実装、変分ベイズ法に基づくモデル実装を行い、単体で解析可能なツールとしてのプロトタイプが完成した。現在、小規模の試験的データを用いた検証を行っており、問題がなければより規模の大きい複数のデータを用いた検証に移行する。解析対象の複雑系疾病については、肺高血圧症172検体(44症例)、HTLV-1関連疾患4,024症例、IgG4関連疾患215検体(82症例)、好酸球性消化管疾患416検体(380症例)の時系列検体を収集した。収集検体の一部については、発現解析(IgG4関連疾患:91検体、肺高血圧症:171検体、好酸球性消化管疾患:102検体)、および、代謝物解析(IgG4関連疾患:154検体、肺高血圧症:172検体、好酸球性消化管疾患:208検体)を実施しており、ツール開発ならびに各解析対象疾患の検体・データ収集が順調に進んでいる。引き続き、各対象疾患の検体収集を継続すると同時に、オミックス解析データの収集に努める。データセットが揃った段階で、各複雑系疾患の時系列オミックスデータに本解析手法を適用し、ツール開発へのフィードバックを行う。フィードバックが完了した時点で大規模オミックス実データを用いた解析へと移行し、当該疾患の病因・病態を解明に有用な知見の導出を目指す。
2: おおむね順調に進展している
当初の研究計画に沿って、JAVA言語をベースとした多階層テンソル因子分解アルゴリズムの実装、変分ベイズ法に基づくモデル実装を行い、複雑なオミックスデータ情報を柔軟に統合・圧縮し、複雑系疾病の解明に有用な特徴量を抽出するための、新規方法論の開発とアルゴリズムの実装を進めた。現在、小規模の試験的データを用いた検証を行っており、問題がなければより規模の大きい複数のデータを用いた検証に移行する。解析対象の複雑系疾病については、肺高血圧症172検体(44症例)、HTLV-1関連疾患4,024症例、IgG4関連疾患215検体(82症例)、好酸球性消化管疾患416検体(380症例)の時系列検体を収集した。収集検体の一部については、発現解析(IgG4関連疾患:91検体、肺高血圧症:171検体、好酸球性消化管疾患:102検体)、および、代謝物解析(IgG4関連疾患:154検体、肺高血圧症:172検体、好酸球性消化管疾患:208検体)が終了しており、ツール開発ならびに各解析対象疾患の検体・データ収集が順調に進んでいる。
試験的データを用いてツールの検証を進め、アルファ版を完成させる。各対象疾患の検体収集を継続すると同時に、オミックス解析データの収集に努める。データセットが揃った段階で、各複雑系疾患の時系列オミックスデータに本解析手法を適用し、ツール開発へのフィードバックを行う。フィードバックが完了した時点で大規模オミックスデータを用いた解析へと移行し、当該疾患の病因・病態を解明に有用な知見の導出を目指す。
研究計画時よりも順調にオミックス検体とデータの収集が進み、データ量の拡大に伴う計算量の増加が見込まれたため、オミックス統合解析を実施するためには、予定より大きなストレージとスペックの高い計算機の購入が必要となった。従って、当該年度はプログラム開発とデータ収集に注力することで研究経費を節約し、翌年度の予算と合わせてビッグデータ解析に必要な上位スペックの計算機を購入する計画にした。本対応により、各疾患の病態解明に向けて、より統計的に優位性が高いデータセットが構築されるため、研究の一層の進展が期待される。
すべて 2017
すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 1件)
BMC Pulmonary Medicine
巻: 17 ページ: 57
10.1186/s12890-017-0400-z
The American Journal of Pathology
巻: 187 ページ: 2246-2258
10.1016/j.ajpath.2017.06.012