研究課題/領域番号 |
16K00052
|
研究機関 | 首都大学東京 |
研究代表者 |
中山 厚穂 首都大学東京, 社会科学研究科, 准教授 (60434198)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 大規模データ / 多相多元データ / スパースデータ / 非対称データ / 次元縮約 / クラスタリング / 多次元尺度構成法 |
研究実績の概要 |
本研究課題では,複数の情報が組み合わされた構造や形式が複雑で大規模なデータの特性に適した解析のための方法論の構築と適切な解析法の選択法の提案を目指して研究を実施する.これまでの研究では,多相多元データの圧縮・分割,非対称データの対称化についての是非についての検討は行われておらず,本研究においてその方法論の構築を行うことができれば多相多元データや非対称データを分析することのニーズが高まっている多くの分野での貢献が期待できる.また,本研究の成果を踏まえ,これまでに扱われてきた大規模で,データの構造や形式が複雑な多相多元データや非対称データ,スパースデータを解析するための新手法を開発することができれば,非常に多くの複雑な社会現象や心理現象を扱う学問分野あるいは応用分野への貢献が期待できると考える. 大規模複雑データを分析する際の適切な手法の選択法についての研究では,Nakayama and Deguchi (2017)において大規模データのためのクラスタ中心を再計算しない非階層的クラスタリング法を提案することにより,大規模データの特性に合わせてクラスタリングを効率的に行う方法についての研究を行った.データがスパースであり大規模というデータの特性に即した解析法についての研究では,Nakayama and Komoda (2017)や菰田・中山(2017)においてdどのような単位で単語を分かち書きするのが,文章からより有益な情報を抽出することができるのか検討を行った.そして,大規模な多相多元データを分析する際にはデータがスパースとなり,データのもつ情報を反映した分析がスムーズに実施できない可能性も考えられ,この課題を解決するために,中山・増田・鶴見 (2017)において研究を実施した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究課題では,複数の情報が組み合わされた構造や形式が複雑で大規模なデータの特性に適した解析のための方法論の構築と適切な解析法の選択法の提案を目指して研究を行った.その結果,各データの特性にそくした解析のための方法論や適切な解析法の選択方法についての研究成果を公表することができている.
|
今後の研究の推進方策 |
本年度に研究を行った大規模データを解析する際の適切な手法を選択するための方法論の妥当性をシミュレーションや実データ(購買履歴データ,Webコミュニケーションデータ,対人関係データ)への適用により検討する.また,応用分野への適用も目指す.以上の研究成果を国際学会で研究発表するとともに,誌上発表を目指す.
|
次年度使用額が生じた理由 |
研究を実施するために利用するデータの取得に係る費用が研究協力者の協力により当初想定していたよりも費用を抑えることができたため差額が生じている.その差額については,翌年度分として請求した助成金と合わせ,当該研究分野の研究の第一人者であるドイツバイロイト大学のProf. Dr. Daniel Baierらとの国際共同研究のために利用する予定である.
|