• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Research-status Report

集約的シンボリックデータ解析の基礎構築

Research Project

Project/Area Number 26330054
Research InstitutionThe Institute of Statistical Mathematics

Principal Investigator

中野 純司  統計数理研究所, 大学共同利用機関等の部局等, 教授 (60136281)

Project Period (FY) 2014-04-01 – 2018-03-31
Keywordsシンボリックデータ / 可視化 / クラスター分析 / 連続変数 / カテゴリー変数
Outline of Annual Research Achievements

現在、データ量が爆発的に増加しており、その解析のためには新しい統計手法が必要となっている。そのような手法のひとつと言えるシンボリックデータ解析は、個々のデータではなくデータの集合からなるグループを対象として解析するため、超大量データを縮約し現実的に扱うことができる。本研究ではグループを多変量分布の実現と考え、それを表現するために適切な記述統計量を用いることを提案し、集約的シンボリックデータと呼ぶ。特に、連続変数とカテゴリー変数が混在している場合を考察する必要がある。
それらのデータを統一的に扱うために、ここでは連続データをカテゴリー数が多いカテゴリーデータと考え、すべてのデータをカテゴリーデータとして扱うことを提案した。そして昨年度提案したクラスター分析の手法をより理論的に考察した。
基本的には2つのカテゴリー変数のペアに対して分割表を考え、その分割表のセル確率をそのグループの特徴量とみなす。そして、2つのグループにおいて、そのセル確率が同じと見なせるかどうかの尤度比検定統計量を2つのグループ間の非類似度と考えるという方法である。さらにその非類似度をより詳しく分解することによって、2つのグループの違いがどこにあるかを調べるための可視化手法も提案した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

当初の目的として(1) 集約的シンボリックデータのモデル化とその記述方法の確立、(2)より高次のモーメントを表現する集約的シンボリックデータの開発、(3)種々の変数が混在する場合の集約的シンボリックデータの表現と解析の開発、(4)集約的シンボリックデータの数理統計的手法の開発、を挙げていた。(1)に関しては昨年度結果を得た。(2)はまだ着手できなかった。(3)についてはすべてをカテゴリー変数として統一的に扱うということを提案した。(4)についてはクラスター分析に関して、尤度比検定統計量を用いることの妥当性を考察できた。従って(2)を除き、着実に目的を達成しつつあると自己評価する。

Strategy for Future Research Activity

当初の計画通りに行う。27年度にある程度の結果を得たので、28年度はこれを論文にまとめたい。すでにその準備として実データの解析も行ったが、その解析はあまり満足のいく物ではなかった。手持ちの大量データを提案手法で解析したのだが、もっともらしい結果は得たものの論文に出すには不十分と考える。したがって、28年度は別のデータを解析する予定で、すでに準備を進めている。なお、大量データ処理が必要になるため、Hadoopや並列化Rなどの計算環境の準備も進めている。理論に関しては、27年度の研究途中で、多重対応分析との比較を考えた。これはカテゴリー変数の連続化であり、この方向の研究が、特にグループそのものの可視化のために必要である。

Causes of Carryover

旅費の残額が生じたが、少額のため次年度使用とする。

Expenditure Plan for Carryover Budget

旅費などに充当する。

  • Research Products

    (5 results)

All 2015

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (4 results) (of which Int'l Joint Research: 2 results,  Invited: 1 results)

  • [Journal Article] 18-year variability of ultraviolet radiation penetration in the mid-latitude coastal waters of the western boundary Pacific2015

    • Author(s)
      Kuwahara, V., Nozaki, S., Nakano, J., Toda. T., Kikuchi, T. and Taguchi, S.
    • Journal Title

      Estuarine, Coastal and Shelf Science

      Volume: 160 Pages: 1-9

    • DOI

      10.1016/j.ecss.2015.03.029.

    • Peer Reviewed
  • [Presentation] Dissimilarity Between Aggregated Symbolic Data with Categorical Variables2015

    • Author(s)
      Nakano, J., Shimizu, N. and Yamamoto, Y.
    • Organizer
      2015 International Workshop for JSCS 30th Anniversary in Okinawa
    • Place of Presentation
      Okinawa, Japan
    • Year and Date
      2015-10-30
    • Int'l Joint Research
  • [Presentation] 連続変数とカテゴリー変数を含む集約的シンボリックデータの特徴抽出2015

    • Author(s)
      中野純司, 山本由和, 清水信夫
    • Organizer
      2015年度統計関連学会連合大会
    • Place of Presentation
      岡山
    • Year and Date
      2015-09-09
  • [Presentation] Visualizing Aggregated Symbolic Data with Continuous and Categorical Variables2015

    • Author(s)
      Nakano, J., Shimizu, N. and Yamamoto, Y.
    • Organizer
      60th World Statistics Congress ISI2015
    • Place of Presentation
      Rio de Janeiro, Brazil
    • Year and Date
      2015-07-28
    • Invited
  • [Presentation] Aggregated symbolic data with continuous and categorical variables and their visualization2015

    • Author(s)
      Nakano, J.
    • Organizer
      ISI-ISM-ISSAS joint Conference 2015
    • Place of Presentation
      Tachikawa, Japan
    • Year and Date
      2015-04-03
    • Int'l Joint Research

URL: 

Published: 2017-01-06  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi