研究課題/領域番号 |
25750130
|
研究機関 | 東京大学 |
研究代表者 |
山田 健太 東京大学, 工学(系)研究科(研究院), 助教 (00609703)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | 大規模ソーシャルデータ分析 / エージェントベースモデル |
研究実績の概要 |
本年度の代表的成果は下記の2点である.
1.人々の複雑な相互作用(コミュニケーション)から生み出される,うわさや流行の伝播もブログやtwitterなどのウェブ上の大規模書き込みデータを解析することで定量的に計測できるようになった.うわさや流行語では,書き込み数が指数関数的成長→減衰→収束と時間変化する特性が見られる.この特性を再現する,エージェントベースモデルをこれまでの研究で提案したが,さらにこのエージェントベースモデルを連立常微分方程式で近似したモデルの理論的解析を基に,流行のライフサイクル方程式を提案した.これまでの研究で観測されたうわさや流行語の書き込み頻度の時間発展は,流行のライフサイクル方程式のパラメータを変化させることでよく表現され,実データからこの方程式の最適なパラメータを推定するアルゴリズムも同時に考案した.また,この方程式は,デマなどのうわさや流行の早期発見や予測に応用が可能である.
2.前年度までに構築したうわさや流行語の伝播を再現するエージェントベースモデルは,エージェント間で情報交換が行われ,うわさや流行語が徐々に広がっていくモデルであった.しかし,ブログデータを観測すると,書き込み数が上昇している時に突発的に書き込み頻度が大きく上昇する現象が見られる.これは,新聞やテレビなどマスコミなどに取り上げられ急激に伝播が加速することが原因であることが分かった.これを再現するために既存モデルのエージェントよりも情報伝播能力が高いマスコミエージェントをエージェントモデルに導入することでこの突発的な上昇を再現し,より現実の書き込み頻度時系列を再現するモデルを構築した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
研究計画時のプランを予定通り実行し、計画時には予定していなかった流行のライフサイクル方程式の提案も行えたため。
|
今後の研究の推進方策 |
これまでは、経験的に蔓延したまたは流行したと思われるうわさや流行語に単語に対して、エージェントベースモデルやライフサイクル方程式を用いたパラメータ推定や再現を行ってきた。しかし、うわさや流行の伝播の統計的性質を明らかにするためには、サンプル数を増やす必要がある。そこで、国語辞典の単語やWikipediaの見出し語を含む数百万種の単語の書き込み頻度を観測し、流行のライフサイクル方程式に当てはまる単語を自動的に抽出するアルゴリズムを構築する。さらに、流行のライフサイクル方程式でよく近似された単語のパラメータの統計的性質を明らかにする。
|
次年度使用額が生じた理由 |
計画時よりも予想外に進展した、流行のライフサイクル方程式に関する内容を学会発表や論文出版するために次年度へ繰り越す。
|
次年度使用額の使用計画 |
学会発表、論文出版に使用する。
|