研究課題/領域番号 |
18K11560
|
研究機関 | 東京大学 |
研究代表者 |
小林 亮太 東京大学, 大学院新領域創成科学研究科, 准教授 (70549237)
|
研究分担者 |
篠本 滋 京都大学, 理学研究科, 准教授 (60187383)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
キーワード | ソーシャルメディア分析 / Webデータ分析 / 時系列モデル / 社会ネットワーク分析 / 計算社会科学 |
研究実績の概要 |
Web上では、時々刻々膨大な量のコンテンツ (1分間にTwitter では45万以上のツイート, Youtube では400時間以上の動画が投稿されている) が生まれている。この中でも、人々に注目されるコンテンツはほんの一部である。本研究では、ソーシャルメディアに着目し、「将来のトレンド (Twitter におけるハッシュタグの流行など) を予測できるのか?」 という問いを設定して研究を進めた。
2020年度は、インターネット上で生じるトレンドについての時系列モデルを構築するため、以下の2つの研究を進めた。 項目A:前年度に開発した、ツイートについてのビッグデータから自動的にトピック分類を行い、トピックのトレンドを抽出する技術を用いて、Twitter における 「いいね」やリツイートがツイートの投稿者へ与える影響を分析した。この結果、Twitterのユーザは投稿 (ツイート) で「いいね」やリツイートをたくさん受けると、その次のツイートでも似たような内容の投稿を行う傾向にあることが明らかになった。この研究成果は、EPJ Data Science 誌から出版された (Adelani, Kobayashi et al., EPJ Data Science, 2020)。
項目B:Wikipedia ページへのアクセス数は、インターネット上における人々の興味 (Wikipedia の項目についての興味) についての指標である。社会で起こるさまざまなイベント (選挙、スポーツの試合、映画の公開、祝日など) について、どのように人々は反応するかについてのモデル構築を進めた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
ツイートデータから自動的にトピックを分類して、トレンドを抽出するデータ分析技術についての論文 (Adelani, Kobayashi et al., EPJ Data Science, 2020) を出版できたため、十分な成果を挙げられたといえる。また、ツイート集団の内容がどれだけ多様であるかを評価する手法についての論文 (Hashimoto et al., , J Supercomput, 2021) についても出版できた。
|
今後の研究の推進方策 |
2020年度に引き続き、Wikipedia のデータを分析、モデル化することで、社会で起こるイベントなどによる外因的トレンドについての時系列モデルの構築を進める。その後、Tweet データからトピックトレンドを抽出することにより、より一般的なトレンドについての時系列モデル化を進めていきたい。 これまで、データ収集を得意とする海外の研究者と連携することにより、Web・ソーシャルメディアデータの分析と数理モデル構築を進めてきた。新型コロナウィルスの感染拡大により、対面での打ち合わせができない状況が1年以上続いており、共同研究を進めるにはきわめて難しい状況である。この状況に対応するため、研究計画の一部を変更し、データ分析技術自体の研究を進めたり、国内研究者との連携を始めたりすることを試みたい。
|
次年度使用額が生じた理由 |
2020年度には、海外研究者と新しい共同研究を始めるための長期出張を計画していたが、新型コロナウィルスの感染拡大により、渡航が延期になってしまっている状況が続いている。
|