研究課題/領域番号 |
25750130
|
研究種目 |
若手研究(B)
|
研究機関 | 早稲田大学 |
研究代表者 |
山田 健太 早稲田大学, 高等研究所, 助教 (00609703)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | 大規模データ分析 / 経験則の確立 / エージェントベースモデル |
研究概要 |
これまでは,詳細なデータがなかったため観測が難しかった,うわさや流行の伝播過程を,ウェブ上に書き込まれた約5000万記事の大規模ブログデータを用いて詳細に観測することにより,うわさや流行の伝播に関する経験則を確立し,それらの経験則を再現するエージェントベースモデルを構築した. 1.大きく盛り上がるうわさや流行に関する単語の使用頻度は指数関数的に上昇し,その後減衰する.減衰後は,完全に忘れられるわけではなく,一定の割合で使用される.また,ブログ上で流行語を使った累積人数は,ロジスティック曲線に従う.情報の伝播に対してロジスティック曲線を用いてフィッティングする試みは古くからあるが,データ数が少ないなど統計的な精度に問題があった.本研究では,大規模データの特性を活かし,統計的に十分な精度で検証を行うことができた. 2.1の経験則を再現するエージェントベースモデルを構築した.モデルはインフルエンザなど感染症の流行のモデルとして数理生物学の分野でよく知られるSIR(Susceptible-Infected-Recovered)モデルを基礎とした.しかしSIRモデルには,ブログを書き込む過程は含まれていない.また,既存のSIRモデルでは,流行後に一定割合で流行語が使用される点を再現することはできない.そこで,SIRモデルを拡張し,ブログの書き込み過程や流行後にも一定割合で使用されるモデルを構築した.さらに,モデルを解析することにより,ブロガーというミクロな構成要素がどのように振る舞うと流行というマクロな現象が創発するのかを明らかにした.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
当初の目標であったデータ解析に加えて,エージェントベースモデルによるモデル化まで研究が進んだため.
|
今後の研究の推進方策 |
現在のエージェントベースモデルは,ウェブの世界を通して全てのエージェントが繋がっている平均場のモデルである.ツイッターなどのSNSサービスでは,フォローフォロワーのネットワーク構造があるので,このネットワーク構造を現在のモデルに加えた時にうわさや流行の伝播がどのように変化するかを解析する. また,現在の解析とモデル化の応用として,東日本大震災の時に見られた,デマの伝播の解析とモデル化を行い,デマの伝播の予測や制御につなげる.
|
次年度の研究費の使用計画 |
格安航空券を購入できたため予定よりも旅費を抑えることができた. 次年度の旅費として使用する.
|