• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実施状況報告書

集約的シンボリックデータ解析の基礎構築

研究課題

研究課題/領域番号 26330054
研究機関統計数理研究所

研究代表者

中野 純司  統計数理研究所, 大学共同利用機関等の部局等, 教授 (60136281)

研究期間 (年度) 2014-04-01 – 2018-03-31
キーワードシンボリックデータ / 可視化 / クラスター分析 / 連続変数 / カテゴリー変数
研究実績の概要

現在、データ量が爆発的に増加しており、その解析のためには新しい統計手法が必要となっている。そのような手法のひとつと言えるシンボリックデータ解析は、個々のデータではなくデータの集合からなるグループを対象として解析するため、超大量データを縮約し現実的に扱うことができる。本研究ではグループを多変量分布の実現と考え、それを表現するために適切な記述統計量を用いることを提案し、集約的シンボリックデータと呼ぶ。特に、連続変数とカテゴリー変数が混在している場合を考察する必要がある。
それらのデータを統一的に扱うために、ここでは連続データをカテゴリー数が多いカテゴリーデータと考え、すべてのデータをカテゴリーデータとして扱うことを提案した。そして昨年度提案したクラスター分析の手法をより理論的に考察した。
基本的には2つのカテゴリー変数のペアに対して分割表を考え、その分割表のセル確率をそのグループの特徴量とみなす。そして、2つのグループにおいて、そのセル確率が同じと見なせるかどうかの尤度比検定統計量を2つのグループ間の非類似度と考えるという方法である。さらにその非類似度をより詳しく分解することによって、2つのグループの違いがどこにあるかを調べるための可視化手法も提案した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

当初の目的として(1) 集約的シンボリックデータのモデル化とその記述方法の確立、(2)より高次のモーメントを表現する集約的シンボリックデータの開発、(3)種々の変数が混在する場合の集約的シンボリックデータの表現と解析の開発、(4)集約的シンボリックデータの数理統計的手法の開発、を挙げていた。(1)に関しては昨年度結果を得た。(2)はまだ着手できなかった。(3)についてはすべてをカテゴリー変数として統一的に扱うということを提案した。(4)についてはクラスター分析に関して、尤度比検定統計量を用いることの妥当性を考察できた。従って(2)を除き、着実に目的を達成しつつあると自己評価する。

今後の研究の推進方策

当初の計画通りに行う。27年度にある程度の結果を得たので、28年度はこれを論文にまとめたい。すでにその準備として実データの解析も行ったが、その解析はあまり満足のいく物ではなかった。手持ちの大量データを提案手法で解析したのだが、もっともらしい結果は得たものの論文に出すには不十分と考える。したがって、28年度は別のデータを解析する予定で、すでに準備を進めている。なお、大量データ処理が必要になるため、Hadoopや並列化Rなどの計算環境の準備も進めている。理論に関しては、27年度の研究途中で、多重対応分析との比較を考えた。これはカテゴリー変数の連続化であり、この方向の研究が、特にグループそのものの可視化のために必要である。

次年度使用額が生じた理由

旅費の残額が生じたが、少額のため次年度使用とする。

次年度使用額の使用計画

旅費などに充当する。

  • 研究成果

    (5件)

すべて 2015

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (4件) (うち国際学会 2件、 招待講演 1件)

  • [雑誌論文] 18-year variability of ultraviolet radiation penetration in the mid-latitude coastal waters of the western boundary Pacific2015

    • 著者名/発表者名
      Kuwahara, V., Nozaki, S., Nakano, J., Toda. T., Kikuchi, T. and Taguchi, S.
    • 雑誌名

      Estuarine, Coastal and Shelf Science

      巻: 160 ページ: 1-9

    • DOI

      10.1016/j.ecss.2015.03.029.

    • 査読あり
  • [学会発表] Dissimilarity Between Aggregated Symbolic Data with Categorical Variables2015

    • 著者名/発表者名
      Nakano, J., Shimizu, N. and Yamamoto, Y.
    • 学会等名
      2015 International Workshop for JSCS 30th Anniversary in Okinawa
    • 発表場所
      Okinawa, Japan
    • 年月日
      2015-10-30
    • 国際学会
  • [学会発表] 連続変数とカテゴリー変数を含む集約的シンボリックデータの特徴抽出2015

    • 著者名/発表者名
      中野純司, 山本由和, 清水信夫
    • 学会等名
      2015年度統計関連学会連合大会
    • 発表場所
      岡山
    • 年月日
      2015-09-09
  • [学会発表] Visualizing Aggregated Symbolic Data with Continuous and Categorical Variables2015

    • 著者名/発表者名
      Nakano, J., Shimizu, N. and Yamamoto, Y.
    • 学会等名
      60th World Statistics Congress ISI2015
    • 発表場所
      Rio de Janeiro, Brazil
    • 年月日
      2015-07-28
    • 招待講演
  • [学会発表] Aggregated symbolic data with continuous and categorical variables and their visualization2015

    • 著者名/発表者名
      Nakano, J.
    • 学会等名
      ISI-ISM-ISSAS joint Conference 2015
    • 発表場所
      Tachikawa, Japan
    • 年月日
      2015-04-03
    • 国際学会

URL: 

公開日: 2017-01-06  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi