• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

大規模コホートの調査票における新規データクリーニング手法の開発

研究課題

研究課題/領域番号 18K10099
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分58030:衛生学および公衆衛生学分野関連:実験系を含まない
研究機関東北大学

研究代表者

牧野 悟士  東北大学, 東北メディカル・メガバンク機構, 助教 (30423403)

研究分担者 田宮 元  東北大学, 東北メディカル・メガバンク機構, 教授 (10317745)
櫻井 利恵子  東北大学, 東北メディカル・メガバンク機構, 非常勤講師 (50794541)
研究期間 (年度) 2018-04-01 – 2021-03-31
研究課題ステータス 完了 (2020年度)
配分額 *注記
3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2019年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2018年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
キーワードコホート研究 / データクリーニング / 外れ値検出
研究成果の概要

大規模ゲノムコホート研究では、綿密な研究計画およびその計画に従った実施体制、エラー防止手法の導入にもかかわらず、種々のエラーの発生が不可避であり、それらのエラーは研究結果に大きく影響を与えるものとなりうる。しかし大規模な調査票をクリーニングすることは人力では不可能であった。そこで、集団からの外れ値を検出する際に既知の情報を利用して主成分分析(PCA)を拡張した統計的モデルを使用することによって、エラー候補検出の自動化および精度向上のための手法を開発し実装した。

研究成果の学術的意義や社会的意義

データクリーニングは、大規模コホート研究のみならず、その重要性が認識されているものの、世界的にコンセンサスを得られた手法は存在しなかった。海外の大規模コホートにおいても、多くはタッチスクリーンベースであるためデータ入力時のエラー発生率は低いと考えられるものの、単純なミスマッチやデータ形式の違いを検出しているのみである。本研究はパターンの違いをエラー検出に利用するため、これまで事実上不可能であった調査票の経時的データや家族間のデータのクリーニングに関しても応用可能となった。

報告書

(4件)
  • 2020 実績報告書   研究成果報告書 ( PDF )
  • 2019 実施状況報告書
  • 2018 実施状況報告書
  • 研究成果

    (6件)

すべて 2020 2019 2018

すべて 雑誌論文 (5件) (うち査読あり 5件、 オープンアクセス 3件) 学会発表 (1件)

  • [雑誌論文] Clustering by phenotype and genome-wide association study in autism2020

    • 著者名/発表者名
      Narita Akira, Nagai Masato, Mizuno Satoshi, Ogishima Soichi et al.
    • 雑誌名

      Translational Psychiatry

      巻: 10 号: 1 ページ: 290-290

    • DOI

      10.1038/s41398-020-00951-x

    • 関連する報告書
      2020 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Genome-wide association study identifies new loci for albuminuria in the Japanese population2020

    • 著者名/発表者名
      Hiroshi Okuda, Koji Okamoto, Michiaki Abe, Kota Ishizawa, Satoshi Makino, Osamu Tanabe, Junichi Sugawara, Atsushi Hozawa, Kozo Tanno, Makoto Sasaki, Gen Tamiya, Masayuki Yamamoto, Sadayoshi Ito, Tadashi Ishii
    • 雑誌名

      Clinical and Experimental Nephrology

      巻: 印刷中 号: 8 ページ: 1-9

    • DOI

      10.1007/s10157-020-01884-x

    • 関連する報告書
      2019 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 3.5KJPNv2: an allele frequency panel of 3552 Japanese individuals including the X chromosome2019

    • 著者名/発表者名
      Tadaka S. et al. Koshiba S. et al. Kinoshita K.(合計25名、本研究者は14番目)
    • 雑誌名

      Hum Genome Var

      巻: 6 号: 1 ページ: 28-28

    • DOI

      10.1038/s41439-019-0059-5

    • 関連する報告書
      2019 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Outlier detection for questionnaire data in biobanks2019

    • 著者名/発表者名
      Sakurai Rieko、Ueki Masao、Makino Satoshi、Hozawa Atsushi、Kuriyama Shinichi、Takai-Igarashi Takako、Kinoshita Kengo、Yamamoto Masayuki、Tamiya Gen
    • 雑誌名

      International Journal of Epidemiology

      巻: 印刷中 号: 4 ページ: 1305-1315

    • DOI

      10.1093/ije/dyz012

    • 関連する報告書
      2018 実施状況報告書
    • 査読あり
  • [雑誌論文] Goodness-of-fit test for the parametric proportional hazard regression model with interval-censored data2018

    • 著者名/発表者名
      Sakurai Rieko、Hattori Satoshi
    • 雑誌名

      Biostatistics & Epidemiology

      巻: 2 号: 1 ページ: 115-131

    • DOI

      10.1080/24709360.2018.1529347

    • 関連する報告書
      2018 実施状況報告書
    • 査読あり
  • [学会発表] バイオバンクにおける質問票データに対する外れ値検出2020

    • 著者名/発表者名
      櫻井利恵子
    • 学会等名
      第2回日本メディカルAI学会学術集会
    • 関連する報告書
      2019 実施状況報告書

URL: 

公開日: 2018-04-23   更新日: 2022-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi