研究課題/領域番号 |
25730019
|
研究機関 | 首都大学東京 |
研究代表者 |
中山 厚穂 首都大学東京, 社会(科)学研究科, 准教授 (60434198)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | 多次元尺度構成法 / 多元データ / 対数線形モデル / スパースデータ / 非負行列因子分解 / 補完類似度 |
研究実績の概要 |
多相多元データと非対称データの構造や形式に即した解析法の選択のための方法論の構築と新解析法の提案を目指した研究を実施した.まず,多相多元データや非対称データの有している特性,理論的性質について整理を行った.そして,既存の解析法と多相多元データや非対称データが有している特性との対応付けを行い,その成果を踏まえ,多相多元データを解析する際に用いるべき相や元の数を選択した上で,それに適した解析法を選択するための方法論について研究を実施した.多相多元データを圧縮・分割することの妥当性についての研究では,対数線形モデルにより多元デーを分析し,各元間の交互作用について検証することで,元を圧縮することの可否について検討する研究を行った.その研究成果はNakayama(印刷中)おにいて論文発表をしている. さらに,様々な実データへの適応可能性について検討した.実データを分析する際には多相多元データをそのまま分析するとデータが疎(スパース)となり,データのもつ情報を反映した分析が上手く実施できない場合がある.疎なデータをどう分析するかは重要な課題となる.疎なデータの分析についての研究を合わせて行った.具体的にはTwitter上の新製品についての書き込みを収集し登場する話題の分類を試みた.分析に利用するデータは書き込み×単語のデータであり疎なデータとなる.そこで,製品の時系列にそって話題は変化すると考え,補完類似度という特徴指標値(単語の出現頻度をもとに対象となる単語の全体での出現頻度とその属性における出現確率を考慮した指標)を用いて抽出し,その後,書き込み×単語のデータを非負行列因子分解により分析した.その結果,話題の分類と時系列的な変化,企業のコミュニケーション戦略との関連性が明らかとなった.その研究成果は中山・増田・鶴見(2015)で論文発表を行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究課題では,多相多元データと非対称データの構造や形式に即した解析法の選択のための方法論の構築と新解析法の提案を目指した研究を実施した.そのために,本年においては,多相多元データと非対称データの特性の整理と理論的特徴づけ,既存のデータ解析手法と各特性との対応付けの実施,多相多元データや非対称データを分析する際の適切な手法の選択についての研究,多相多元データや非対称データを分析するための新解析法の開発提案について研究を実施した.その結果,多相多元データを分析する際の適切な手法の選択法についての研究についてはNakayama(印刷中)において研究の成果を誌上発表することができ,また多相多元データの構造や形式に即した解析法の選択のための方法論の構築のための研究では中山・増田・鶴見(2015)において研究成果を誌上発表することができ,今後の研究における課題は存在するが,当初の計画は達成できていると考える.また,非対称データの構造や形式に即した解析法の選択のための方法論の構築と新解析法の提案についての研究についても,既存研究の整理などを行うとともに順調に進めることができている.
|
今後の研究の推進方策 |
本研究課題の目的はは多相多元データと非対称データの構造や形式に即した解析法の選択のための方法論の構築と新解析法の提案を目指した研究を実施することにある.次年度以降は,より詳細な多相多元データと非対称データの特性の整理と理論的な特徴づけ,既存のデータ解析法と各特性との対応付けの実施,多相多元データと非対称データの構造と形式を考慮した上での適切な解析法の選択についての研究などから得られた成果をもとに,多相多元データや非対称データを分析するための新たな手法についての研究を進め,既存手法の一般化,拡張,精密化に取り組む.さらに,多相多元データや非対称データを分析する際の適切な手法を選択するための方法論と新解析手法の妥当性をシミュレーションや実データへの適用により検討する.そして,購買履歴データ,ウェブアクセスログデータ,対人関係データなどの様々な実データへ研究の成果を適用し,応用分野への応用可能性についても検討する.以上の研究成果をデータ解析や統計学の分野について国際学会や国内学会での口頭発表や誌上発表を目指す.
|