研究課題/領域番号 |
26330054
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
統計科学
|
研究機関 | 統計数理研究所 |
研究代表者 |
中野 純司 統計数理研究所, モデリング研究系, 教授 (60136281)
|
研究協力者 |
清水 信夫
山本 由和
|
研究期間 (年度) |
2014-04-01 – 2019-03-31
|
研究課題ステータス |
完了 (2018年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2017年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2016年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2015年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2014年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
|
キーワード | カテゴリー変数 / シンボリックデータ / 分類 / 連続変数 / 相関関係 / 非類似度 / 可視化 / クラスター分析 |
研究成果の概要 |
個体データが大量にある場合、それらの意味のある集合に着目する場合が多い。例えば、数千羽の鳥の体長や体重、色、種などのデータが得られているとき、個体の集合としての種の特徴を知りたい。その場合、グループの特徴を少数の記述統計量で表したものをシンボリックデータと呼ぶ。本研究では個々のデータが連続変数とカテゴリー変数を持つ場合を考える。カテゴリー変数はダミー変数を用いて表し、連続変数とともに2次までのモーメント統計量を構成し、それを集約的シンボリックデータと呼ぶ。そして集約的シンボリックデータ間の非類似度や、可視化を提案した。
|
研究成果の学術的意義や社会的意義 |
現在、データ量が爆発的に増加しており、その解析のために新しい手法が必要となっている。個々のデータではなくデータのグループを対象とするシンボリックデータ解析は、超大量データを縮約し、人間が現実的に扱い理解することを可能にする手法である。最近は実用的で強力だが人間が解釈・理解することの難しい手法も機械学習や人工知能の分野で多く開発されている。ただ、社会的にも学術的にも、現象の本質を人間が理解することは重要である。コンピュータ、通信、センサーなどの技術の発展により、観測されるデータの量は莫大になっている。そのようなデータを人間に近づけるために集約的シンボリックデータ解析は有用である。
|