• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実施状況報告書

多相多元データと非対称データの特性に即した解析法選択のための方法と新解析法の提案

研究課題

研究課題/領域番号 25730019
研究機関首都大学東京

研究代表者

中山 厚穂  首都大学東京, 社会(科)学研究科, 准教授 (60434198)

研究期間 (年度) 2013-04-01 – 2016-03-31
キーワード多次元尺度構成法 / 多元データ / 対数線形モデル / スパースデータ / 非負行列因子分解 / 補完類似度
研究実績の概要

多相多元データと非対称データの構造や形式に即した解析法の選択のための方法論の構築と新解析法の提案を目指した研究を実施した.まず,多相多元データや非対称データの有している特性,理論的性質について整理を行った.そして,既存の解析法と多相多元データや非対称データが有している特性との対応付けを行い,その成果を踏まえ,多相多元データを解析する際に用いるべき相や元の数を選択した上で,それに適した解析法を選択するための方法論について研究を実施した.多相多元データを圧縮・分割することの妥当性についての研究では,対数線形モデルにより多元デーを分析し,各元間の交互作用について検証することで,元を圧縮することの可否について検討する研究を行った.その研究成果はNakayama(印刷中)おにいて論文発表をしている.
さらに,様々な実データへの適応可能性について検討した.実データを分析する際には多相多元データをそのまま分析するとデータが疎(スパース)となり,データのもつ情報を反映した分析が上手く実施できない場合がある.疎なデータをどう分析するかは重要な課題となる.疎なデータの分析についての研究を合わせて行った.具体的にはTwitter上の新製品についての書き込みを収集し登場する話題の分類を試みた.分析に利用するデータは書き込み×単語のデータであり疎なデータとなる.そこで,製品の時系列にそって話題は変化すると考え,補完類似度という特徴指標値(単語の出現頻度をもとに対象となる単語の全体での出現頻度とその属性における出現確率を考慮した指標)を用いて抽出し,その後,書き込み×単語のデータを非負行列因子分解により分析した.その結果,話題の分類と時系列的な変化,企業のコミュニケーション戦略との関連性が明らかとなった.その研究成果は中山・増田・鶴見(2015)で論文発表を行った.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本研究課題では,多相多元データと非対称データの構造や形式に即した解析法の選択のための方法論の構築と新解析法の提案を目指した研究を実施した.そのために,本年においては,多相多元データと非対称データの特性の整理と理論的特徴づけ,既存のデータ解析手法と各特性との対応付けの実施,多相多元データや非対称データを分析する際の適切な手法の選択についての研究,多相多元データや非対称データを分析するための新解析法の開発提案について研究を実施した.その結果,多相多元データを分析する際の適切な手法の選択法についての研究についてはNakayama(印刷中)において研究の成果を誌上発表することができ,また多相多元データの構造や形式に即した解析法の選択のための方法論の構築のための研究では中山・増田・鶴見(2015)において研究成果を誌上発表することができ,今後の研究における課題は存在するが,当初の計画は達成できていると考える.また,非対称データの構造や形式に即した解析法の選択のための方法論の構築と新解析法の提案についての研究についても,既存研究の整理などを行うとともに順調に進めることができている.

今後の研究の推進方策

本研究課題の目的はは多相多元データと非対称データの構造や形式に即した解析法の選択のための方法論の構築と新解析法の提案を目指した研究を実施することにある.次年度以降は,より詳細な多相多元データと非対称データの特性の整理と理論的な特徴づけ,既存のデータ解析法と各特性との対応付けの実施,多相多元データと非対称データの構造と形式を考慮した上での適切な解析法の選択についての研究などから得られた成果をもとに,多相多元データや非対称データを分析するための新たな手法についての研究を進め,既存手法の一般化,拡張,精密化に取り組む.さらに,多相多元データや非対称データを分析する際の適切な手法を選択するための方法論と新解析手法の妥当性をシミュレーションや実データへの適用により検討する.そして,購買履歴データ,ウェブアクセスログデータ,対人関係データなどの様々な実データへ研究の成果を適用し,応用分野への応用可能性についても検討する.以上の研究成果をデータ解析や統計学の分野について国際学会や国内学会での口頭発表や誌上発表を目指す.

  • 研究成果

    (4件)

すべて 2015 2014

すべて 雑誌論文 (2件) (うち査読あり 2件、 謝辞記載あり 2件) 学会発表 (2件)

  • [雑誌論文] Evaluating the Necessity of aTriadic Distance Model2015

    • 著者名/発表者名
      Atsuho Nakayama
    • 雑誌名

      Proceedings of econd European Conference on Data Analysis (ECDA), Springe

      巻: 印刷中 ページ: 印刷中

    • 査読あり / 謝辞記載あり
  • [雑誌論文] 製品時系列を考慮したTwitter上のトピック分類2015

    • 著者名/発表者名
      中山厚穂・増田純也・ 鶴見裕之
    • 雑誌名

      データ分析の理論と応用

      巻: 4 ページ: 17-41

    • 査読あり / 謝辞記載あり
  • [学会発表] 大規模データのクラスタリング2014

    • 著者名/発表者名
      出口慎二・中山厚穂・高崎祐哉
    • 学会等名
      日本行動計量学会第42回大会
    • 発表場所
      東北大学(宮城県仙台市)
    • 年月日
      2014-09-08
  • [学会発表] Evaluating the Necessity of aTriadic Distance Model2014

    • 著者名/発表者名
      Atsuho Nakayama
    • 学会等名
      Second European Conference on Data Analysis (ECDA),
    • 発表場所
      Jacobs University Bremen, Germany
    • 年月日
      2014-07-03

URL: 

公開日: 2016-06-01  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi