• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2017 Fiscal Year Research-status Report

A quantitative study of diffusion processes of popular trends: an application of time series analysis of word counts in nationwide blog data

Research Project

Project/Area Number 17K13815
Research InstitutionThe Institute of Statistical Mathematics

Principal Investigator

渡邊 隼史  統計数理研究所, リスク解析戦略研究センター, 特任助教 (30783956)

Project Period (FY) 2017-04-01 – 2020-03-31
Keywords流行解析 / Ultraslow diffusion / 拡散現象 / ブログ解析 / ソーシャルメディア解析 / 複雑系 / 長期記憶
Outline of Annual Research Achievements

本研究はブログのキーワード時系列についてその性質の基礎研究を行うことが一つ目的である. 基礎研究としては「十分定着した語」→「新語」の解析という手順で研究を進める予定であり,今年度はそのうち「十分定着した語」について研究を進めた.
具体的には,主に論文化とそれに伴う性質のより詳細な研究や日本語ブログ以外でのデータでの研究の適応可能性を調べた.結果,(1)非整数微積分学との関連や解析的な近似解などブログのキーワード時系列の数学的な性質がより明確になった(これまでは主に数値的に性質がわかっていたが今年度の研究により解析的な性質がより明らかになった).(2)「十分定着した語」の対数拡散やそのほかの解析結果について,これまで研究していた日本語ブログ以外のデータ―新聞やWikipediaなどのデータセット,および,英語や中国語など日本語以外の言語―でも成立することがわかった.特に(2)により,本研究が「日本語ブログ」という限られたデータだけでなく,「時間付きのテキストデータ」というより広い範囲への適応可能なことを示せた.
これらの成果について,論文2本をプレプリントサーバーに投稿し,現在,そのうち一本について投稿論文として査読をすすめている.加えて,計算社会科学ワークショップ,計量言語学会,統計学連合大会で関連成果を発表することで,これまでの主に発表してきた物理学以外の分野との研究の交流を行った.さらに,経済社会物理と計算社会科学分野の2つの国際学会でも学会発表を行った.

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

本研究は「十分定着した語」→「新語」の解析という手順で研究を進める予定であり,今年度は新語に着手する予定であった. しかし,今年度は,「十分定着した語」にとどまった.理由は,論文成果化のための査読等の対応のため,予定外に日本語ブログ以外のデータセットを解析を必要としため,その追加研究のデータ取得と解析に時間がかかっためである.ただし,この解析により,「十分定着した語」の対数拡散について,ブログ以外の新聞やWikipediaなどのデータセット,および,英語や中国語など日本語以外の言語でも成立することがわかり,研究の適用範囲を広くすることができた.

Strategy for Future Research Activity

まず,既存の成果の「十分定着した語」について査読の対応を完了し,年度の早いうちに論文として公表することを目指す.さらに,その関連成果として年度の前半に「ゆらぎのスケーリング」に関してもう一つの論文の原稿作成と投稿を行う.同時に,新語のデータの取得などの準備・予備解析に着手し,年度後半より本格的に解析研究に着手したい. また,今年度の研究でブログ以外の新たなデータセットでの研究適応可能性もわかったので,それらのデータの研究への使用も検討する.

  • Research Products

    (6 results)

All 2018 2017

All Presentation (6 results) (of which Int'l Joint Research: 2 results,  Invited: 1 results)

  • [Presentation] 様々な単語頻度時系列に共通して観測される対数的な拡散2018

    • Author(s)
      渡邊隼史
    • Organizer
      第二回計算社会科学ワークショップ
  • [Presentation] ブログにおけるキーワードの書き込み時系列の物理学的観点での解析2017

    • Author(s)
      渡邊隼史,佐野幸恵,高安秀樹,高安美佐子
    • Organizer
      計量国語学会第六十一回大会
  • [Presentation] ブログ上の形容詞時系列アンサンブルのランダム成分の特性を利用した一国規模の社会イベントのインパクトの計量2017

    • Author(s)
      渡邊 隼史
    • Organizer
      統計関連学会連合大会
  • [Presentation] Statistical properties of fluctuations of time series representing appearances of words in nationwide blog data and their applications2017

    • Author(s)
      H. Watanabe, Y. Sano, H. Takayasu , M. Takayasu
    • Organizer
      International Conference on Computational Social Science
    • Int'l Joint Research
  • [Presentation] The probability distributions and the fluctuation scalings of the time series of key-word counts in nation-wide blog data2017

    • Author(s)
      H. Watanabe, Y. Sano, H. Takayasu , M. Takayasu
    • Organizer
      Econophysics Colloquium 2017
    • Int'l Joint Research
  • [Presentation] 具体例から考える”整っていない”大規模データの解析 -誤った解析を減らし,少しでも明瞭な結果を得るために-2017

    • Author(s)
      渡邊隼史
    • Organizer
      ネットワーク科学セミナー2017統計数理研究所
    • Invited

URL: 

Published: 2018-12-17  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi