研究課題
2021年度は、前年度の成果を踏まえ、スノーボールサンプリングによるTweetの収集システムの完成に継続的に取り組んだ。具体的には、フォロワー数の多いアカウントを起点にフォロワーのアカウントを収集し、2021年度までに合計5500万件強のアカウントを収集した。本プロジェクトは第一段階のアカウント、第二段階のTweetと二段階方式によりTweetを収集し、全てのアカウントのTweetを継続的に収集することを念頭に置いていた。しかし、恒常的により短いサイクルで収集を継続するために、収集したアカウントからランダムにサンプリングしたアカウントから、継続的にTweetを収集するプログラムを開発するに至った。新規に生成されたアカウントを追加していく際にも同様の仕様でランダムにサンプリングを繰り返し、Tweetを収集するアカウントを常に母集団の構成を反映するよう設計した。2021年度の研究は、Twitterのデータベースを構築するという当初の目的を踏まえたものであり、2019年度までに開発したランダムサンプリングによる収集の精度をスノーボールサンプリングのもとで維持できるかを追究したものである。2019年度に行った研究では、特定のキーワード(選挙時の政党名など)の増減やトピックモデルによるトピックの抽出について詳細な検討を加え、その成果を情報科学分野の主要査読誌であるInternational Journal of Information Managementに査読を経て掲載された。同様に、スノーボールサンプリングにより得られたTwitterデータがどの程度ランダムサンプリングと近い構成になっているかを継続的に検討する。
すべて 2022 2021 その他
すべて 国際共同研究 (1件) 雑誌論文 (2件) (うち国際共著 1件、 査読あり 2件、 オープンアクセス 2件) 図書 (4件)
Japanese Journal of Political Science
巻: advanced access ページ: 1~17
10.1017/S1468109922000056
PLOS ONE
巻: 16 ページ: e0261658
10.1371/journal.pone.0261658