2021 Fiscal Year Research-status Report
Topic Transition Analysis from Millions of Tweets After Severe Disasters
Project/Area Number |
18K11443
|
Research Institution | Chiba University of Commerce |
Principal Investigator |
橋本 隆子 千葉商科大学, 商経学部, 教授 (80551697)
|
Co-Investigator(Kenkyū-buntansha) |
岡本 洋 東京大学, 大学院工学系研究科(工学部), 特任研究員 (00374067)
久保山 哲二 学習院大学, 付置研究所, 教授 (80302660)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | ソーシャルメディア解析 / データマイニング / ビッグデータ解析 / 多様性 / 時系列話題解析 / マイクロクラスタリング |
Outline of Annual Research Achievements |
意義:本研究は大規模災害(東日本大震災等)時に投稿された数億件規模のTwitterデータを対象とし、話題の成長パターン分析とそのモデル化を行うことを目的としている。人々の行動や社会に対して大きな影響を与えるソーシャルメディア上の話題を可視化し、話題拡散の様子を示し、人々のコミュニケーション、話題の信頼性評価や議論の推移予測をサポートする技術の開発を目指す。今年度はコロナワクチン関する大規模Twitterデータに対して、各種話題(デマやそうでない話題も含む)の成長の様子の時系列分析を行った。 1. Two-Stage Clustering 手法の開発:2021年度は、SNSにおける人々の反応を分析するために、マイクロクラスタリングと時系列クラスタリングを組み合わせた Two-Stage Clustering 手法を提案し、コロナワクチンに対するTwitterデータ(全量データ)の分析を行った。コロナワクチンに関する12M以上のTweet集合を、速報ニュースへの反応、Tweetへの反応、その他(デマなど)に分類できることを示した。 2. コロナワクチンに関する人々の反応評価(時系列分析):さらにTwitterの全量データを対象として、コロナワクチンに対する人々の反応のセンチメント分析(時系列評価)にも取り組んでおり、コロナワクチンに対する日本国民の気持ちが時間とともにどのような変遷をたどったかについて考察している。 3. マイクロクラスタリング手法の改良:大規模データに対応可能とするために、マイクロクラスタリング手法を、より類似度の高いインスタンスを初期のタイミングで集約する改良を行った。これにより、数千万件規模のTwitterデータが標準的なPC上でリーズナブルな速度で分析可能となった。大規模データ分析において、極めて重要な成果であると認識している。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2021年度の計画は、各種災害に関する「SNS上で発生する人々の反応の分類・整理」であったが、Two-Stage Clustering 手法により、大まかな分類、整理が出来たと考える。対象話題に対する内容の類似度(マイクロクラスタリングによる分類)に加え、時系列上のパターンの類似度でクラスタリングを行うことにより、人々の反応(集団的な行動)を速報ニュースへの反応、Tweetへの反応、その他(デマなど)に分類出来る可能性を示すことが出来た。特に時系列変化を見ることで、急激な成長や衰退を可視化することが可能となり、本テーマにおける構造変化分析の重要性が確認出来た。 また、マイクロクラスタリング手法の改良により、数千万件規模のTwitterデータが標準的なPC上でリーズナブルな速度で分析可能となった。大規模データ分析において、極めて重要な成果であると認識している。
|
Strategy for Future Research Activity |
1.Two-Stage Clustering 手法のさらなる開発 2021年度は、SNSにおける人々の反応を分析するために、マイクロクラスタリングと時系列クラスタリングを組み合わせた Two-Stage Clustering 手法を提案し、BigData2021にも採択された。この手法は、これまで内容の類似度に加えて、時系列上のパターン類似度を考慮できる効率的な手法であり、これにより、コロナワクチンに関する12M以上のTweet集合を、速報ニュースへの反応、Tweetへの反応、その他(デマなど)に分類できることを示した。2022年度は、Two-Stage Clustering 手法の効果を更に確認するために、他の話題(オリンピックや選挙など)への適応、時系列手法の精査などを行う。これにより、何らかの事象が発生したときの人々の反応分析の制度を挙げ、当初目的としている集合行動把握へとつなげていく。 2.SNS上で発生する集合行動の分類・整理の精緻化 Two-Stage Clustering手法の分析結果を受け、SNS上でどのような集合行動が発生しているか、その際に対象話題に対してどのような構造変化が起きているかの観察・分析・整理を行い、モデル化の基礎となる概念の体系化を行う。意見の偏り、意見の対立、急激な成長といった話題の構造変化が集合行動を表現すると考え、実データによる観察を行う。また、社会科学的観点から集合行動を調査・考察し、SNS上での集合行動が誘発するであろう現象の考察と、それらの現象の実データでの検証も行う。これらを通じて、集合構造を表現する形質情報を抽出・定義する。
|
Causes of Carryover |
コロナ感染拡大に伴い、研究計画を再延長した。学会はオンライン参加となったため、旅費を使うことはなかったが、その分の予算を研究を広く世にアピールするWebサイトの構築などに活用した。
|
Remarks |
上記サイトは、日本語版・英語版 両方を公開中。
|
-
-
[Journal Article] Two-stage Clustering Method for Discovering People's Perceptions: A Case Study of the COVID-19 Vaccine from Twitter2021
Author(s)
Hashimoto, T., Uno, T., Takedomi, Y., Shepard, D., Toyoda, M., Yoshinaga, N., ... & Kobayashi, R.
-
Journal Title
2021 IEEE International Conference on Big Data
Volume: 1
Pages: 614-621
DOI
Peer Reviewed / Int'l Joint Research
-
-
-
-
-
-
[Presentation] Two-stage Clustering Method for Discovering People's Perceptions: A Case Study of the COVID-19 Vaccine from Twitter2021
Author(s)
Hashimoto, T., Uno, T., Takedomi, Y., Shepard, D., Toyoda, M., Yoshinaga, N., ... & Kobayashi, R.
Organizer
2021 IEEE International Conference on Big Data (Big Data)
-
-
-
-