• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

A quantitative study of diffusion processes of popular trends: an application of time series analysis of word counts in nationwide blog data

Research Project

Project/Area Number 17K13815
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeMulti-year Fund
Research Field Commerce
Research InstitutionKanazawa University (2018-2020)
The Institute of Statistical Mathematics (2017)

Principal Investigator

Watanabe Hayafumi  金沢大学, 電子情報通信学系, 助教 (30783956)

Project Period (FY) 2017-04-01 – 2021-03-31
Project Status Completed (Fiscal Year 2020)
Budget Amount *help
¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)
Fiscal Year 2019: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
Fiscal Year 2018: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
Fiscal Year 2017: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Keywords時間付きテキストデータ / 大規模データ解析 / ソーシャルメディア解析 / 時系列解析 / 拡散現象 / 複雑システム科学 / 言語データ / 新聞データ / 普及 / 新語 / 時系列データ / 時間発展方程式 / 歴史新聞データ / OCR / 統計物理 / 普及現象 / ブログ解析 / 新語の定着 / 関連語 / SNS解析 / 文書長 / 超慢拡散 / 長期記憶 / 社会的記憶 / 非整数微積分 / SNSデータ / 新聞記事 / 流行解析 / Ultraslow diffusion / 複雑系 / 計算社会学 / 統計物理学 / マーケティング / ソーシャルメディア / 統計科学・社会データ解析
Outline of Final Research Achievements

We studied the temporal change of word uses in time series data such as blogs and newspapers. The most important result of this study is that we found the logarithmic growth (i.e., ultraslow diffusion) of the time-series of word counts of already popular words by analyzing three different nationwide language databases: (i) newspaper articles (Japanese), (ii) blog articles (Japanese), and (iii) page views of Wikipedia (English, French, Chinese, and Japanese). Through theoretical research, we also suggested a relationship between this observation and social memory. In addition, We have started a joint research on newspaper data from the Meiji, Taisho and Shouwa periods and transformed the original format data to pdf data.

Academic Significance and Societal Importance of the Research Achievements

本研究の一番の主要成果である十分定着した語に関する対数関数的拡散現象の発見は,言語科学的には,言語の種類(日本語,フランス語,中国語,英語)や媒体(新聞,ブログ,Page view)に依存しない時間的な言語法則の新たな発見の可能性もある。また,物理学的には,理論的な研究はなれてきたが,現実の観測がほとんどなかったultra slow diffusion という現象の稀な現実観測例になっている。加えて,明治大正昭和の新聞データに関する言語OCR研究は,今後研究が順調に進み開発に成功すれば,社会学、言語学、情報科学など言語データを使う様々な分野で共通に使われる言語資源の提供につながる可能性もある。

Report

(5 results)
  • 2020 Annual Research Report   Final Research Report ( PDF )
  • 2019 Research-status Report
  • 2018 Research-status Report
  • 2017 Research-status Report
  • Research Products

    (21 results)

All 2021 2020 2019 2018 2017

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 1 results) Presentation (19 results) (of which Int'l Joint Research: 6 results,  Invited: 2 results)

  • [Journal Article] The Fractional Calculus and the Logarithmic Diffusion in Nation Wide Language Data with Time Stamps: How Stable Are the Usages of Already Popular Words?2020

    • Author(s)
      渡邊 隼史
    • Journal Title

      Bulletin of the Japan Society for Industrial and Applied Mathematics

      Volume: 30 Issue: 2 Pages: 10-17

    • DOI

      10.11540/bjsiam.30.2_10

    • NAID

      130007919840

    • ISSN
      2432-1982
    • Year and Date
      2020-06-24
    • Related Report
      2020 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Empirical observations of ultraslow diffusion driven by the fractional dynamics in languages2018

    • Author(s)
      Hayafumi Watanabe
    • Journal Title

      Physical review E

      Volume: 98 Pages: 012308-012308

    • Related Report
      2018 Research-status Report
    • Peer Reviewed
  • [Presentation] Webデータと現地調査データを用いた空物件が入居されるまで期間の統計解析 ―Webデータの物件の特性からどこまで入居の予測が可能か?―2021

    • Author(s)
      渡邊 隼史, 一藤 裕, 鈴木 雅人, 村上 大輔, 山下 智志
    • Organizer
      第15回日本統計学会春季集会
    • Related Report
      2020 Annual Research Report
  • [Presentation] Statistical modeling of logarithmic diffusions in word counts time series in nation-wide language data sets2019

    • Author(s)
      Hayafumi Watanabe
    • Organizer
      Conference Data Science, “Statistical modeling of logarithmic diffusions in word counts time series in nation-wide language data sets”, Statistics and Visualisation (DSSV 2019)
    • Related Report
      2019 Research-status Report
    • Int'l Joint Research
  • [Presentation] Statistical properties and modeling of stable-like word count time series in nation-wide language data2019

    • Author(s)
      Hayafumi Watanabe
    • Organizer
      Young Business and Industrial Statisticians Workshop on Recent Advances in Data Science and Business Analytics
    • Related Report
      2019 Research-status Report
    • Int'l Joint Research
  • [Presentation] Webの書き込みデータにみる数理構造と社会的な記憶―社会に十分定着した語は日々どのくらい変化しているか?―2019

    • Author(s)
      渡邊隼史
    • Organizer
      計算社会科学とその周辺セミナー
    • Related Report
      2019 Research-status Report
    • Invited
  • [Presentation] Web不動産データを用いた空物件が入居されるまでの期間に関するデータ特性を考慮した統計モデリング2019

    • Author(s)
      渡邊 隼史, 一藤 裕, 鈴木 雅人, 山下 智志
    • Organizer
      2019年度人工知能学会全国大会
    • Related Report
      2019 Research-status Report
  • [Presentation] Web不動産データを用いた空物件が入居されるまで期間の確率モデリング ―物件の特性からどこまで入居の予測が可能か?2019

    • Author(s)
      渡邊 隼史, 一藤 裕, 鈴木 雅人, 山下 智志
    • Organizer
      第14回 Webインテリジェンスとインタラクション研究会
    • Related Report
      2019 Research-status Report
  • [Presentation] 時間付きテキスト上に観測される超慢拡散(対数拡散)2019

    • Author(s)
      渡邊隼史
    • Organizer
      平成30年度統数研研究会「社会物理学の新展開」
    • Related Report
      2018 Research-status Report
  • [Presentation] Empirical observations of ultraslow diffusion in languages: Dynamical statistical properties of word counts of already popular words2018

    • Author(s)
      H. Watanabe
    • Organizer
      Conference on Complex Systems 2018 (CCS 2018)
    • Related Report
      2018 Research-status Report
    • Int'l Joint Research
  • [Presentation] Multivariate analysis of the occupations of rental rooms by using the housing information web site data2018

    • Author(s)
      H. Watanabe and Yu Ichifuji and Masahito Suzuki and Satoshi Yamashita
    • Organizer
      International Workshop on Data Science 2018
    • Related Report
      2018 Research-status Report
    • Int'l Joint Research
  • [Presentation] Web不動産データを用いた空物件が埋まる遷移に関する多変量解析2018

    • Author(s)
      渡邊 隼史 一藤 裕 鈴木 雅人 山下 智志
    • Organizer
      2018年度人工知能学会全国大会
    • Related Report
      2018 Research-status Report
  • [Presentation] 大規模ブログデータベースを用いた食の流行の現状把握―ベンチャー企業での開発―2018

    • Author(s)
      渡邊隼史
    • Organizer
      テキストマイニング 2018
    • Related Report
      2018 Research-status Report
  • [Presentation] 日本語のブログのおける形容詞の書き込み頻度時系列の確率的特性とイベントのインパクト計量への応用2018

    • Author(s)
      渡邊隼史
    • Organizer
      日本行動計量学会 第46回大会
    • Related Report
      2018 Research-status Report
  • [Presentation] 十分社会に定着した単語の使用は日々どれくらいづつ変化してるか?-一国規模の単語使用頻度時系列における対数拡散-2018

    • Author(s)
      渡邊隼史
    • Organizer
      経済・社会への分野横断的研究会
    • Related Report
      2018 Research-status Report
  • [Presentation] 様々な単語頻度時系列に共通して観測される対数的な拡散2018

    • Author(s)
      渡邊隼史
    • Organizer
      第二回計算社会科学ワークショップ
    • Related Report
      2017 Research-status Report
  • [Presentation] ブログにおけるキーワードの書き込み時系列の物理学的観点での解析2017

    • Author(s)
      渡邊隼史,佐野幸恵,高安秀樹,高安美佐子
    • Organizer
      計量国語学会第六十一回大会
    • Related Report
      2017 Research-status Report
  • [Presentation] ブログ上の形容詞時系列アンサンブルのランダム成分の特性を利用した一国規模の社会イベントのインパクトの計量2017

    • Author(s)
      渡邊 隼史
    • Organizer
      統計関連学会連合大会
    • Related Report
      2017 Research-status Report
  • [Presentation] Statistical properties of fluctuations of time series representing appearances of words in nationwide blog data and their applications2017

    • Author(s)
      H. Watanabe, Y. Sano, H. Takayasu , M. Takayasu
    • Organizer
      International Conference on Computational Social Science
    • Related Report
      2017 Research-status Report
    • Int'l Joint Research
  • [Presentation] The probability distributions and the fluctuation scalings of the time series of key-word counts in nation-wide blog data2017

    • Author(s)
      H. Watanabe, Y. Sano, H. Takayasu , M. Takayasu
    • Organizer
      Econophysics Colloquium 2017
    • Related Report
      2017 Research-status Report
    • Int'l Joint Research
  • [Presentation] 具体例から考える”整っていない”大規模データの解析 -誤った解析を減らし,少しでも明瞭な結果を得るために-2017

    • Author(s)
      渡邊隼史
    • Organizer
      ネットワーク科学セミナー2017統計数理研究所
    • Related Report
      2017 Research-status Report
    • Invited

URL: 

Published: 2017-04-28   Modified: 2022-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi