• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

Establishing the foundation of aggregated symbolic data analysis

Research Project

Project/Area Number 26330054
Research InstitutionThe Institute of Statistical Mathematics

Principal Investigator

中野 純司  統計数理研究所, モデリング研究系, 教授 (60136281)

Project Period (FY) 2014-04-01 – 2019-03-31
Keywordsシンボリックデータ / 相関関係 / 連続変数 / カテゴリー変数
Outline of Annual Research Achievements

現在、データ量が爆発的に増加しており、その解析のためには新しい統計手法が必要となっている。そのような手法のひとつと言えるシンボリックデータ解析は、個々のデータではなくデータの集合からなるグループを対象として解析するため、超大量データを縮約し現実的に扱うことができる。ただ、これまでの研究ではグループを表現するために区間データなど周辺分布の情報だけを考えることが多かったが、その妥当性はあまり考慮されなかった。本研究ではひとつのグループをある多変量分布の実現値の集合と考え、それを表現するために適切な記述統計量を用いることを提案し、集約的シンボリックデータと呼ぶ。そして集約的シンボリックデータの 1) 情報損失の少ない表現、2) これまでの研究との関係、3) 種々の数理統計的手法、を研究・開発することを目的とする。
これまでの研究で、集約的シンボリックデータの表現としては2次までのモーメント統計量を用いること、連続変数とカテゴリー変数を同等に扱えること、が重要であることがわかった。また、2つの集約的シンボリックデータ間の非類似度として(疑似)尤度比検定統計量やカイ二乗統計量を用いることを考えた。
さらに、集約的シンボリックデータ内の変数間の関係を表すために分割表の独立性の検定を利用することを提案したが、これには少々不都合な点があることがわかった。すなわち、2つのカテゴリー変数の関連性が高い場合を適切に記述しにくいということが判明した。
それで、本年はカテゴリー変数間の関連性を計るためにポリコリック相関係数を用いることを提案した。これを用いるとカテゴリー変数と連続変数の関係も表現することができることがわかった。これを用いて東京都の賃貸物件データを解析したところ、変数間の関係を適切に表していることが確認できた。

  • Research Products

    (2 results)

All 2018

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (1 results)

  • [Journal Article] 集約的シンボリックデータのカイ2乗統計量を 用いた非類似度とその不動産情報データへの適用2018

    • Author(s)
      清水 信夫、中野 純司、山本 由和
    • Journal Title

      統計数理

      Volume: 66 Pages: 279-294

    • Peer Reviewed / Open Access
  • [Presentation] 集約的シンボリックデータの変数選択2018

    • Author(s)
      清水信夫, 中野純司, 山本由和
    • Organizer
      統計関連学会連合大会

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi