2010 Fiscal Year Annual Research Report
インターネットの書き込みにおける人間集団行動の統計物理的考察
Project/Area Number |
22656025
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
高安 美佐子 東京工業大学, 大学院・総合理工学研究科, 准教授 (20296776)
|
Keywords | 数理物理 / ネットワーク / 社会学 / 行動学 |
Research Abstract |
インターネットのブログの中の書き込み記事のテータ解析を行い、キーワードの出現頻度に関する経験的な法則を統計物理学の方法を用いて網羅的に探し出す研究を進めている。 ブログの書き込み数は既存の検索エンジンを活用しているが、本来の人間の書き込みだけでなく、様々なシステマティックな変動成分があり、それを丁寧に除去し、観測結果の信頼度を高める前処理が不可欠であり、その手法を確立した。スパム的な自動生成されたブログをフィルターで落とす、週単位の投稿数の変動やサーバーダウンなどによる突発的な変動の効果を除去するため、投稿数そのものではなく、全数で規格化した比率にして観測する、などの処置をすることによってこの目的はほぼ達成できることを明らかにした。 副詞などの日常的に使われる単語の頻度は、この処置によって、期待されるような定常性を確認できるようになった。そのとき、出現数の平均値と分散は単純な比例関係が観測されるのは頻度がある程度以上小さい単語だけであり、それ以上頻度の大きい単語に関しては、分散が平均値の2乗にしたがって大きく揺らぐことを発見し、その原因が全投稿者数のランダムな変動が原因となっていることを理論的に明らかにした。この平均値と分散の解析結果を活用することにより、定常的でランダムな出現をする単語の統計性を特徴づけることができるので、そこから乖離する単語として一時的にブームを起こすような単語を自動的に取り出すことができるようになった。 特定の日をピークに出現数が増加減少する現象に注目し、多くの場合、その関数形がピークの日からの日数のベキ乗でよく近似できることを明らかにすることができた。
|