• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Research-status Report

多相多元データと非対称データの特性に即した解析法選択のための方法と新解析法の提案

Research Project

Project/Area Number 25730019
Research InstitutionTokyo Metropolitan University

Principal Investigator

中山 厚穂  首都大学東京, 社会(科)学研究科, 准教授 (60434198)

Project Period (FY) 2013-04-01 – 2016-03-31
Keywords多次元尺度構成法 / 多元データ / 対数線形モデル / スパースデータ / 非負行列因子分解 / 補完類似度
Outline of Annual Research Achievements

多相多元データと非対称データの構造や形式に即した解析法の選択のための方法論の構築と新解析法の提案を目指した研究を実施した.まず,多相多元データや非対称データの有している特性,理論的性質について整理を行った.そして,既存の解析法と多相多元データや非対称データが有している特性との対応付けを行い,その成果を踏まえ,多相多元データを解析する際に用いるべき相や元の数を選択した上で,それに適した解析法を選択するための方法論について研究を実施した.多相多元データを圧縮・分割することの妥当性についての研究では,対数線形モデルにより多元デーを分析し,各元間の交互作用について検証することで,元を圧縮することの可否について検討する研究を行った.その研究成果はNakayama(印刷中)おにいて論文発表をしている.
さらに,様々な実データへの適応可能性について検討した.実データを分析する際には多相多元データをそのまま分析するとデータが疎(スパース)となり,データのもつ情報を反映した分析が上手く実施できない場合がある.疎なデータをどう分析するかは重要な課題となる.疎なデータの分析についての研究を合わせて行った.具体的にはTwitter上の新製品についての書き込みを収集し登場する話題の分類を試みた.分析に利用するデータは書き込み×単語のデータであり疎なデータとなる.そこで,製品の時系列にそって話題は変化すると考え,補完類似度という特徴指標値(単語の出現頻度をもとに対象となる単語の全体での出現頻度とその属性における出現確率を考慮した指標)を用いて抽出し,その後,書き込み×単語のデータを非負行列因子分解により分析した.その結果,話題の分類と時系列的な変化,企業のコミュニケーション戦略との関連性が明らかとなった.その研究成果は中山・増田・鶴見(2015)で論文発表を行った.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究課題では,多相多元データと非対称データの構造や形式に即した解析法の選択のための方法論の構築と新解析法の提案を目指した研究を実施した.そのために,本年においては,多相多元データと非対称データの特性の整理と理論的特徴づけ,既存のデータ解析手法と各特性との対応付けの実施,多相多元データや非対称データを分析する際の適切な手法の選択についての研究,多相多元データや非対称データを分析するための新解析法の開発提案について研究を実施した.その結果,多相多元データを分析する際の適切な手法の選択法についての研究についてはNakayama(印刷中)において研究の成果を誌上発表することができ,また多相多元データの構造や形式に即した解析法の選択のための方法論の構築のための研究では中山・増田・鶴見(2015)において研究成果を誌上発表することができ,今後の研究における課題は存在するが,当初の計画は達成できていると考える.また,非対称データの構造や形式に即した解析法の選択のための方法論の構築と新解析法の提案についての研究についても,既存研究の整理などを行うとともに順調に進めることができている.

Strategy for Future Research Activity

本研究課題の目的はは多相多元データと非対称データの構造や形式に即した解析法の選択のための方法論の構築と新解析法の提案を目指した研究を実施することにある.次年度以降は,より詳細な多相多元データと非対称データの特性の整理と理論的な特徴づけ,既存のデータ解析法と各特性との対応付けの実施,多相多元データと非対称データの構造と形式を考慮した上での適切な解析法の選択についての研究などから得られた成果をもとに,多相多元データや非対称データを分析するための新たな手法についての研究を進め,既存手法の一般化,拡張,精密化に取り組む.さらに,多相多元データや非対称データを分析する際の適切な手法を選択するための方法論と新解析手法の妥当性をシミュレーションや実データへの適用により検討する.そして,購買履歴データ,ウェブアクセスログデータ,対人関係データなどの様々な実データへ研究の成果を適用し,応用分野への応用可能性についても検討する.以上の研究成果をデータ解析や統計学の分野について国際学会や国内学会での口頭発表や誌上発表を目指す.

  • Research Products

    (4 results)

All 2015 2014

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Acknowledgement Compliant: 2 results) Presentation (2 results)

  • [Journal Article] Evaluating the Necessity of aTriadic Distance Model2015

    • Author(s)
      Atsuho Nakayama
    • Journal Title

      Proceedings of econd European Conference on Data Analysis (ECDA), Springe

      Volume: 印刷中 Pages: 印刷中

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] 製品時系列を考慮したTwitter上のトピック分類2015

    • Author(s)
      中山厚穂・増田純也・ 鶴見裕之
    • Journal Title

      データ分析の理論と応用

      Volume: 4 Pages: 17-41

    • Peer Reviewed / Acknowledgement Compliant
  • [Presentation] 大規模データのクラスタリング2014

    • Author(s)
      出口慎二・中山厚穂・高崎祐哉
    • Organizer
      日本行動計量学会第42回大会
    • Place of Presentation
      東北大学(宮城県仙台市)
    • Year and Date
      2014-09-08
  • [Presentation] Evaluating the Necessity of aTriadic Distance Model2014

    • Author(s)
      Atsuho Nakayama
    • Organizer
      Second European Conference on Data Analysis (ECDA),
    • Place of Presentation
      Jacobs University Bremen, Germany
    • Year and Date
      2014-07-03

URL: 

Published: 2016-06-01  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi