2017 Fiscal Year Research-status Report
Project/Area Number |
16K08638
|
Research Institution | Tohoku University |
Principal Investigator |
田宮 元 東北大学, 東北メディカル・メガバンク機構, 教授 (10317745)
|
Co-Investigator(Kenkyū-buntansha) |
植木 優夫 久留米大学, 付置研究所, 准教授 (10515860)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | ゲノム / 遺伝学 / 機械学習 |
Outline of Annual Research Achievements |
本研究は、深層学習の枠組みを利用して、高次元の表現型計測データから健康状態変数を特徴表現抽出するためのソフトウェアを開発することを目的としている。これをADNI(800人余りのアルツハイマー病コホート)のような公開ゲノムコホートデータや東北メディカル・メガバンク機構で収集されている数万人規模の大規模ゲノムコホートデータへ適用して、遺伝子×遺伝子ならびに遺伝子×環境相互作用の同定を可能にする。平成29年度は、平成28年度に作成されたソフトウェアを、実際のゲノムコホートデータの解析について応用を進めた。すなわち、実際のゲノムコホートデータを与えて、特徴表現抽出を行い、抽出された健康状態変数を応答変数とし、ゲノムワイドSNPs情報と環境因子(生活習慣)、その相互作用を説明変数とした高次元変数選択による網羅的解析を進めた。 詳細手順は以下のとおり。1)健康状態変数の構築。平成28年度に作成された深層学習ソフトウェアを、ADNIデータや東北メディカル・メガバンク機構で収集された表現型データに適用し、特徴表現抽出を行い、健康状態変数として定義した。さらに、健康状態変数値に対応する実際の健康状態変化をprospectiveに記録し、今後の更なる応用に備えた。2)網羅的分析による効果を持つ因子の同定。上記の健康状態変数を応答変数とし、ゲノムワイドSNPs情報、環境因子(生活習慣)、その相互作用項を全て説明変数として含めて、高次元変数選択法によるアソシエーション解析を行った。高次元変数選択手法としては、申請者がこれまでの研究で罰則付き回帰(Sure Independence Search; SIS)を実装したソフトウェアプログラムを利用した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究は、深層学習の枠組みを利用して、高次元の表現型計測データから健康状態変数を特徴表現抽出するためのソフトウェアを開発することを目的としている。これをADNI(800人余りのアルツハイマー病コホート)のような公開ゲノムコホートデータや東北メディカル・メガバンク機構で収集されている数万人規模の大規模ゲノムコホートデータへ適用して、遺伝子×遺伝子ならびに遺伝子×環境相互作用の同定を可能にするものである。平成28年度に、当初の予定通り、入力とする表現型の選抜とそのスケーリングの検討、深層学習のための多層ニューラルネットをデザインし、テストデータを与えて、特徴表現学習のトレーニングとフィードバックを行った。このプロトタイピングをもとに、健康状態変数を抽出するための深層学習アルゴリズムのソフトウェア実装を行った。引き続き平成29年度についても、当初の予定通り、実際のゲノムコホートデータを与えて、特徴表現抽出を行い、抽出された健康状態変数を応答変数とし、ゲノムワイドSNPs情報と環境因子(生活習慣)、その相互作用を説明変数とした高次元変数選択による網羅的解析を進めた。
|
Strategy for Future Research Activity |
引き続き、実際のゲノムコホートデータを与えて、特徴表現抽出を行い、抽出された健康状態変数を応答変数とし、ゲノムワイドSNPs情報と環境因子(生活習慣)、その相互作用を説明変数とした高次元変数選択による網羅的解析を行う。また、同定された因子のアノテーションとリストアップを進める。具体的には、上記手順で同定された遺伝子や環境因子、その相互作用を機能的な情報でアノテーションし、リストアップして、追試研究に提供する。
|
Causes of Carryover |
ソフトウェアを開発するにあたり、計算環境を進捗に合わせて拡張してきた。特に、公共データベースから得られたデータや、計算実行時の一時データを保存するための、ストレージ増設を予定していた。年度途中にそれらデータベースの更新をキャッチアップする予定であったが、小規模にリソースを追加するよりも、購入時期をずらすことによって、同価格でより容量の多い後継品を選ぶほうが効率的と考えられた。データの一時保存先を調整することにより、ストレージ拡張まで研究計画の進捗に影響することがないものと見込んでいる。また、次年度のデータが蓄積されてきた時点で、次年度使用額に相当する範囲内で購入可能な、より容量の多い後継品を購入する。
|
Research Products
(16 results)
-
[Journal Article] Evaluation of reported pathogenic variants and their frequencies in a Japanese population based on a whole-genome reference panel of 2049 individuals2017
Author(s)
Yamaguchi-Kabata Y, Yasuda J, Tanabe O, Suzuki Y, Kawame H, Fuse N, Nagasaki M, Kawai Y, Kojima K, Katsuoka F, Saito S, Danjoh I, Motoike IN, Yamashita R, Koshiba S, Saigusa D, Tamiya G, Kure S, Yaegashi N, Kawaguchi Y, Nagami F, Kuriyama S, Sugawara J, Minegishi N, Hozawa A, Ogishima S, Kiyomoto H, et al.
-
Journal Title
J Hum Genet.
Volume: 63
Pages: 213~230
DOI
Peer Reviewed
-
[Journal Article] Genome-wide meta-analysis in Japanese populations identifies novel variants at the TMC6-TMC8 and SIX3-SIX2 loci associated with HbA1c.2017
Author(s)
Hachiya T, Komaki S, Hasegawa Y, Ohmomo H, Tanno K, Hozawa A, Tamiya G, Yamamoto M, Ogasawara K, Nakamura M, Hitomi J, Ishigaki Y, Sasaki M, Shimizu A.
-
Journal Title
Sci Rep.
Volume: 7
Pages: 16147
DOI
Peer Reviewed / Open Access
-
[Journal Article] Security controls in an integrated Biobank to protect privacy in data sharing: rationale and study design2017
Author(s)
Takai-Igarashi T, Kinoshita K, Nagasaki M, Ogishima S, Nakamura N, Nagase S, Nagaie S, Saito T, Nagami F, Minegishi N, Suzuki Y, Suzuki K, Hashizume H, Kuriyama S, Hozawa A, Yaegashi N, Kure S, Tamiya G, Kawaguchi Y, Tanaka H, Yamamoto M.
-
Journal Title
BMC Med Inform Decis Mak.
Volume: 17
Pages: 100
DOI
Peer Reviewed / Open Access
-
-
-
-
-
-
-
-
-
-
-
-
-