• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実施状況報告書

Twitterデータベースの構築と政治学的課題への応用

研究課題

研究課題/領域番号 18K01423
研究機関早稲田大学

研究代表者

日野 愛郎  早稲田大学, 政治経済学術院, 教授 (30457816)

研究期間 (年度) 2018-04-01 – 2022-03-31
キーワードソーシャルメディア / Twitter / ランダムサンプリング / スノーボールサンプリング / 代表性 / アーカイブ
研究実績の概要

2020年度は、TwitterのアカウントIDの生成がかつての10桁の連番から18桁のランダム生成に変更されたことを踏まえて、スノーボールサンプリングによる収集方法を開発した。具体的には、フォロワー数の多いアカウントを起点にフォロワーのアカウントを収集し、2020年度は4000万件弱のアカウントを収集した。本プロジェクトにおいてこれまで検討してきた二段階方式によるTweetの収集では、全てのアカウントを継続的に収集することを念頭に置いていた。しかし、恒常的により短いサイクルで収集を継続するために、収集したアカウントからランダムにサンプリングしたアカウントから、継続的にTweetを収集するプログラムを開発した。新規に生成されたアカウントを追加していく際にも同様の仕様でランダムにサンプリングを繰り返し、Tweetを収集するアカウントを常に母集団の構成を反映するよう設計されている。
上記の2020年度の研究は、Twitterのデータベースを構築するという当初の目的を踏まえたものであり、どの程度前年度までに開発したランダムサンプリングによる収集の精度をスノーボールサンプリングのもとで維持できるかを追究したものである。前年度は、特定のキーワード(選挙時の政党名など)の増減やトピックモデルによるトピックの抽出について詳細な検討を加え、その成果を情報科学分野の主要査読誌であるInternational Journal of Information Managementに査読を経て掲載された。同様に、スノーボールサンプリングにより得られたTwitterデータがどの程度ランダムサンプリングと近い構成になっているかを継続的に検討する必要がある。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

当初の計画通り、ランダムサンプリングにより収集したツイッターのデータを、母集団と比較することにより、ランダムサンプリングにより代表性を担保できることを確認することができた。研究成果を海外の主要な査読誌に掲載できおり、良好であると判断した。また、現在はスノーボールサンプリングにより収集したデータの代表性を検証している。

今後の研究の推進方策

スノーボーリングサンプリングにより収集するプログラムを構築し、収集したデータを母集団と比較することにより、代表性の程度を検証する作業を引き続き進める。このためには、Firehoseにより収集された母集団のデータのアクセスを確保し、検証する必要がある。

次年度使用額が生じた理由

ツイートの取得用のプログラムを効率化することにより、使用額を当初の予定よりも抑えることができた。一方、取得したツイートはクラウドサービスに蓄積されており、次年度以降における利用料を多く見込む必要があり、計画に組み込むことにした。また、データを経時的に収集することにより検証の精度を上げることができるため、2021年度においても継続してデータを収集し、実質的な問題に応えるだけの代表性が担保されているかを確認する。

  • 研究成果

    (8件)

すべて 2021 2020 その他

すべて 国際共同研究 (1件) 雑誌論文 (4件) (うち国際共著 1件、 オープンアクセス 1件、 査読あり 1件) 学会発表 (2件) (うち国際学会 1件) 図書 (1件)

  • [国際共同研究] ブリュッセル自由大学/カトリック・ルーヴァン大学(ベルギー)

    • 国名
      ベルギー
    • 外国機関名
      ブリュッセル自由大学/カトリック・ルーヴァン大学
  • [雑誌論文] COVID-19, digital privacy, and the social limits on data-focused public health responses2020

    • 著者名/発表者名
      Fahey, R. and Hino, A.
    • 雑誌名

      International Journal of Information Management

      巻: Vol.55 ページ: 1-5

    • DOI

      10.1016/j.ijinfomgt.2020.102181

    • オープンアクセス
  • [雑誌論文] The intensity of government - opposition divide as measured through legislative speeches and what we can learn from it: Analyses of Japanese parliamentary debates, 1953-20132020

    • 著者名/発表者名
      Curini, L., Hino, A, and Osaki, A.
    • 雑誌名

      Government and Opposition

      巻: Vol. 55, No.2 ページ: 184-201

    • DOI

      10.1017/gov.2018.15

    • 査読あり / 国際共著
  • [雑誌論文] Japan: Political development and data for 20192020

    • 著者名/発表者名
      Hino, A. and Ogawa, H.
    • 雑誌名

      European Journal of Political Research, Political Data Yearbook

      巻: Vol. 59 ページ: 214-224

    • DOI

      10.1111/2047-8852.12300

  • [雑誌論文] マルチレベル選挙における動員と選挙疲れ―亥年現象の解明に向けて―2020

    • 著者名/発表者名
      Song, J.・日野愛郎
    • 雑誌名

      選挙研究

      巻: Vol. 36, No.1 ページ: 23-34

    • DOI

      10.1111/2047-8852.12300

  • [学会発表] Belief in Conspiracy Theories and Socio-Political Identity in Japan2020

    • 著者名/発表者名
      Hino, A., Fahey, R. A., Camatarri, S., & Jungkunz, S.
    • 学会等名
      American Political Science Association Annual Conference
    • 国際学会
  • [学会発表] マルチレベル選挙における動員と選挙疲れ―亥年現象の解明に向けて―2020

    • 著者名/発表者名
      Song, J.・日野愛郎
    • 学会等名
      日本選挙学会
  • [図書] The Oxford Handbook of Japanese Politics2021

    • 著者名/発表者名
      Fahey, R. A., Hino, A. and Pekkanen, R. J.
    • 総ページ数
      1000
    • 出版者
      Oxford University Press
    • ISBN
      9780190050993

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi