• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2010 Fiscal Year Annual Research Report

インターネットの書き込みにおける人間集団行動の統計物理的考察

Research Project

Project/Area Number 22656025
Research InstitutionTokyo Institute of Technology

Principal Investigator

高安 美佐子  東京工業大学, 大学院・総合理工学研究科, 准教授 (20296776)

Keywords数理物理 / ネットワーク / 社会学 / 行動学
Research Abstract

インターネットのブログの中の書き込み記事のテータ解析を行い、キーワードの出現頻度に関する経験的な法則を統計物理学の方法を用いて網羅的に探し出す研究を進めている。
ブログの書き込み数は既存の検索エンジンを活用しているが、本来の人間の書き込みだけでなく、様々なシステマティックな変動成分があり、それを丁寧に除去し、観測結果の信頼度を高める前処理が不可欠であり、その手法を確立した。スパム的な自動生成されたブログをフィルターで落とす、週単位の投稿数の変動やサーバーダウンなどによる突発的な変動の効果を除去するため、投稿数そのものではなく、全数で規格化した比率にして観測する、などの処置をすることによってこの目的はほぼ達成できることを明らかにした。
副詞などの日常的に使われる単語の頻度は、この処置によって、期待されるような定常性を確認できるようになった。そのとき、出現数の平均値と分散は単純な比例関係が観測されるのは頻度がある程度以上小さい単語だけであり、それ以上頻度の大きい単語に関しては、分散が平均値の2乗にしたがって大きく揺らぐことを発見し、その原因が全投稿者数のランダムな変動が原因となっていることを理論的に明らかにした。この平均値と分散の解析結果を活用することにより、定常的でランダムな出現をする単語の統計性を特徴づけることができるので、そこから乖離する単語として一時的にブームを起こすような単語を自動的に取り出すことができるようになった。
特定の日をピークに出現数が増加減少する現象に注目し、多くの場合、その関数形がピークの日からの日数のベキ乗でよく近似できることを明らかにすることができた。

  • Research Products

    (3 results)

All 2010 Other

All Presentation (1 results) Book (1 results) Remarks (1 results)

  • [Presentation] 日本語ブログにおける日常語の書き込み頻度の統計性とRandom Diffusion Modelの拡張2010

    • Author(s)
      渡邊隼史、佐野幸恵、山田健太、高安秀樹、高安美佐子
    • Organizer
      日本物理学会2010年秋季大会
    • Place of Presentation
      大阪府立大学
    • Year and Date
      2010-09-24
  • [Book] Econophysics Approaches to Large-Scale Business Data and Financial Crisis2010

    • Author(s)
      Misako Takayasu (編著)
    • Total Pages
      342
    • Publisher
      Springer
  • [Remarks]

    • URL

      http://www.smp.dis.titech.ac.jp/intro.php

URL: 

Published: 2012-07-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi