研究課題/領域番号 |
21H03559
|
配分区分 | 補助金 |
研究機関 | 千葉商科大学 |
研究代表者 |
橋本 隆子 千葉商科大学, 商経学部, 教授 (80551697)
|
研究分担者 |
宇野 毅明 国立情報学研究所, 情報学プリンシプル研究系, 教授 (00302977)
栗田 和宏 国立情報学研究所, 情報学プリンシプル研究系, 特任研究員 (40885266)
申 吉浩 学習院大学, 付置研究所, 教授 (60523587)
小林 亮太 東京大学, 大学院新領域創成科学研究科, 准教授 (70549237)
久保山 哲二 学習院大学, 付置研究所, 教授 (80302660)
|
研究期間 (年度) |
2021-04-01 – 2026-03-31
|
キーワード | ソーシャルメディア / データマイニング / ビッグデータ解析 / 集合行動 / 多様性 / 反応分析 |
研究実績の概要 |
1. Two-Stage Clustering 手法の開発 2021年度は、SNSにおける人々の反応を分析するために、マイクロクラスタリングと時系列クラスタリングを組み合わせた Two-Stage Clustering 手法を提案し、コロナワクチンに対するTwitterデータ(全量データ)の分析を行った。この手法は、これまで内容の類似度に加えて、時系列上のパターン類似度を考慮できる効率的な手法であり、これにより、コロナワクチンに関する12M以上のTweet集合を、速報ニュースへの反応、Tweetへの反応、その他(デマなど)に分類できることを示した。結果を論文としてまとめ、BigData2021にも採択された。また招待講演等でも紹介を行った。 2. コロナワクチンに関する人々の反応評価(時系列分析) さらにTwitterの全量データを対象として、コロナワクチンに対する人々の反応のセンチメント分析(時系列評価)にも取り組んでおり、コロナワクチンに対する日本国民の気持ちが時間とともにどのような変遷をたどったかについて考察している。結果は、近日中に社会科学系のジャーナルに投稿予定である。 3. マイクロクラスタリング手法の改良 大規模データに対応可能とするために、マイクロクラスタリング手法を、より類似度の高いインスタンスを初期のタイミングで集約する改良を行った。これにより、数千万件規模のTwitterデータが標準的なPC上でリーズナブルな速度で分析可能となった。大規模データ分析において、極めて重要な成果であると認識している。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2021年度の計画は、「SNS上で発生する集合行動の分類・整理」であったが、Two-Stage Clustering 手法により、大まかな分類、整理が出来たと考える。対象話題に対する内容の類似度(マイクロクラスタリングによる分類)に加え、時系列上のパターンの類似度でクラスタリングを行うことにより、人々の反応(集団的な行動)を速報ニュースへの反応、Tweetへの反応、その他(デマなど)に分類出来る可能性を示すことが出来た。特に時系列変化を見ることで、急激な成長や衰退を可視化することが可能となり、本テーマにおける構造変化分析の重要性が確認出来た。 また、マイクロクラスタリング手法の改良により、数千万件規模のTwitterデータが標準的なPC上でリーズナブルな速度で分析可能となった。大規模データ分析において、極めて重要な成果であると認識している。
|
今後の研究の推進方策 |
1.Two-Stage Clustering 手法のさらなる開発 2021年度は、SNSにおける人々の反応を分析するために、マイクロクラスタリングと時系列クラスタリングを組み合わせた Two-Stage Clustering 手法を提案し、BigData2021にも採択された。この手法は、これまで内容の類似度に加えて、時系列上のパターン類似度を考慮できる効率的な手法であり、これにより、コロナワクチンに関する12M以上のTweet集合を、速報ニュースへの反応、Tweetへの反応、その他(デマなど)に分類できることを示した。2022年度は、Two-Stage Clustering 手法の効果を更に確認するために、他の話題(オリンピックや選挙など)への適応、時系列手法の精査などを行う。これにより、何らかの事象が発生したときの人々の反応分析の制度を挙げ、当初目的としている集合行動把握へとつなげていく。
2.SNS上で発生する集合行動の分類・整理の精緻化 Two-Stage Clustering手法の分析結果を受け、SNS上でどのような集合行動が発生しているか、その際に対象話題に対してどのような構造変化が起きているかの観察・分析・整理を行い、モデル化の基礎となる概念の体系化を行う。意見の偏り、意見の対立、急激な成長といった話題の構造変化が集合行動を表現すると考え、実データによる観察を行う。また、社会科学的観点から集合行動を調査・考察し、SNS上での集合行動が誘発するであろう現象の考察と、それらの現象の実データでの検証も行う。これらを通じて、集合構造を表現する形質情報を抽出・定義する。
|