• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実績報告書

データサイエンスの基盤:クラウドを活用したDandDインスタンスライブラリの構築

研究課題

研究課題/領域番号 26330048
研究機関慶應義塾大学

研究代表者

柴田 里程  慶應義塾大学, 理工学部(矢上), 名誉教授 (60089828)

研究期間 (年度) 2014-04-01 – 2017-03-31
キーワードデータサイエンス / データの変容 / データの活用 / オープンデータ / e-stat / TextilePlot / DandD / R
研究実績の概要

本研究の最終年度である平成28年度は,これまでの研究成果を集大成するとともに外部の研究者の評価を受け,それを成果に反映することに重点を置いて研究を進めた.
具体的な成果物はすでに http://datascience.jp/TRAD.html で公開しており,2本の柱よりなる.一つはデータ活用環境 TRAD ( TextilePlot, R and DandD ),もう一つが 厚労省患者調査データのDandDインスタンスライブラリである.
前者は,データサイエンス実践に当たりいつも最初の障害となる「データの変容」を理論面から強力にサポートするソフトウエア環境として集大成されており,数十万記録,数千変量のデータでもストレスなく扱うことができる.またTextilePlot よる中立な視覚化により,データの背後に潜む現象を直観的に捉えることができるようになった.さらに,TRADの備えるデータ解析環境Rとシームレスな連携機能により,具体的な解析やモデル構築はRで,TextilePlot による視覚化による全体的な把握という使い分けをすることで,より的確な解析を効率的に行い,眠っているデータの活用に新しい道を開く強力な環境を構築できた.
もう一本の柱は,e-stat に代表されるオープンデータのDandD ライブラリーの構築である.本研究では,もっとも複雑に入り組んだオープンデータと言われる厚労省患者調査データを対象にその300以上のデータファイルをTRADによりインスタンスライブラリとして効率的に構築することに成功した.その過程で得た数々の知見は,TRADの設計に反映されている.特に様々なフィルター機能,Frequency に代表される適切なデータ型の設定機能は,本ライブラリーの構築に限らず広く役立つ機能であることが実証された.

  • 研究成果

    (6件)

すべて 2016 その他

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 1件) 学会発表 (3件) 備考 (1件)

  • [雑誌論文] Asymptotic Distribution of Cramer-von Mises Statistic When Contamination Exists2016

    • 著者名/発表者名
      M. Naka and R. Shibata
    • 雑誌名

      International Journal of Statistics and Probability

      巻: 5 ページ: 90-97

    • DOI

      10.5539/ijsp.v5n1p90

    • 査読あり / オープンアクセス
  • [雑誌論文] A good approximation of the Gaussian likelihood of simultaneous autoregressive model which yields us an asymptotically efficient estimate of parameters2016

    • 著者名/発表者名
      Y. Rikimaru and R. Shibata
    • 雑誌名

      Journal of Statistical Planning and Inference

      巻: 173 ページ: 31-46

    • DOI

      10.1016/j.jspi.2016.01.003

    • 査読あり
  • [学会発表] データサイエンス実践の支援環境TRAD2016

    • 著者名/発表者名
      横内大介,柴田里程
    • 学会等名
      統計関連学会連合大会
    • 発表場所
      金沢大学(石川県・金沢市)
    • 年月日
      2016-09-07
  • [学会発表] データ解析の初期段階におけるTextilePlotの活用2016

    • 著者名/発表者名
      仲真弓,柴田里程
    • 学会等名
      統計関連学会連合大会
    • 発表場所
      金沢大学(石川県・金沢市)
    • 年月日
      2016-09-07
  • [学会発表] フィッシャー情報量行列が特異になる場合のパラメータ推定2016

    • 著者名/発表者名
      力丸佑紀,柴田里程
    • 学会等名
      統計関連学会連合大会
    • 発表場所
      金沢大学(石川県・金沢市)
    • 年月日
      2016-09-06
  • [備考] TRAD 公開ページ

    • URL

      http://datascience.jp/TRAD.html

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi