• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

大規模ブログデータを用いた流行・普及現象の網羅的定量研究―新語時系列解析の応用―

研究課題

研究課題/領域番号 17K13815
研究種目

若手研究(B)

配分区分基金
研究分野 商学
研究機関金沢大学 (2018-2020)
統計数理研究所 (2017)

研究代表者

渡邊 隼史  金沢大学, 電子情報通信学系, 助教 (30783956)

研究期間 (年度) 2017-04-01 – 2021-03-31
研究課題ステータス 完了 (2020年度)
配分額 *注記
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2019年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2018年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2017年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
キーワード時間付きテキストデータ / 大規模データ解析 / ソーシャルメディア解析 / 時系列解析 / 拡散現象 / 複雑システム科学 / 言語データ / 新聞データ / 普及 / 新語 / 時系列データ / 時間発展方程式 / 歴史新聞データ / OCR / 統計物理 / 普及現象 / ブログ解析 / 新語の定着 / 関連語 / SNS解析 / 文書長 / 超慢拡散 / 長期記憶 / 社会的記憶 / 非整数微積分 / SNSデータ / 新聞記事 / 流行解析 / Ultraslow diffusion / 複雑系 / 計算社会学 / 統計物理学 / マーケティング / ソーシャルメディア / 統計科学・社会データ解析
研究成果の概要

ブログや新聞等の時間付きデータにおける単語の使用の時間変化について研究を行った。本研究の一番の成果は,十分定着した語の単語使用数が対数関数的な速度で変化していることを明らかにしたことにある。この法則が日本語ブログだけなく,国内新聞や英語はフランス語のWikipediaでも共通して観測されることも示した。さらに理論研究により,社会的記憶との関係性も示唆した。また,新語普及についても,簡単な微分方程式にで多くの時間変化が統一的に説明できることを示唆し,論文化に向けて研究を進めている。さらに,明治大正昭和の新聞データに関する共同研究を開始し,独自フォーマットデータからpdfデータへの変換を完了した。

研究成果の学術的意義や社会的意義

本研究の一番の主要成果である十分定着した語に関する対数関数的拡散現象の発見は,言語科学的には,言語の種類(日本語,フランス語,中国語,英語)や媒体(新聞,ブログ,Page view)に依存しない時間的な言語法則の新たな発見の可能性もある。また,物理学的には,理論的な研究はなれてきたが,現実の観測がほとんどなかったultra slow diffusion という現象の稀な現実観測例になっている。加えて,明治大正昭和の新聞データに関する言語OCR研究は,今後研究が順調に進み開発に成功すれば,社会学、言語学、情報科学など言語データを使う様々な分野で共通に使われる言語資源の提供につながる可能性もある。

報告書

(5件)
  • 2020 実績報告書   研究成果報告書 ( PDF )
  • 2019 実施状況報告書
  • 2018 実施状況報告書
  • 2017 実施状況報告書
  • 研究成果

    (21件)

すべて 2021 2020 2019 2018 2017

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 1件) 学会発表 (19件) (うち国際学会 6件、 招待講演 2件)

  • [雑誌論文] 大規模日付つき言語データに観測される対数拡散と分数階微積分―十分定着した単語の使用はどのように安定しているか?―2020

    • 著者名/発表者名
      渡邊 隼史
    • 雑誌名

      応用数理

      巻: 30 号: 2 ページ: 10-17

    • DOI

      10.11540/bjsiam.30.2_10

    • NAID

      130007919840

    • ISSN
      2432-1982
    • 年月日
      2020-06-24
    • 関連する報告書
      2020 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Empirical observations of ultraslow diffusion driven by the fractional dynamics in languages2018

    • 著者名/発表者名
      Hayafumi Watanabe
    • 雑誌名

      Physical review E

      巻: 98 ページ: 012308-012308

    • 関連する報告書
      2018 実施状況報告書
    • 査読あり
  • [学会発表] Webデータと現地調査データを用いた空物件が入居されるまで期間の統計解析 ―Webデータの物件の特性からどこまで入居の予測が可能か?―2021

    • 著者名/発表者名
      渡邊 隼史, 一藤 裕, 鈴木 雅人, 村上 大輔, 山下 智志
    • 学会等名
      第15回日本統計学会春季集会
    • 関連する報告書
      2020 実績報告書
  • [学会発表] Statistical modeling of logarithmic diffusions in word counts time series in nation-wide language data sets2019

    • 著者名/発表者名
      Hayafumi Watanabe
    • 学会等名
      Conference Data Science, “Statistical modeling of logarithmic diffusions in word counts time series in nation-wide language data sets”, Statistics and Visualisation (DSSV 2019)
    • 関連する報告書
      2019 実施状況報告書
    • 国際学会
  • [学会発表] Statistical properties and modeling of stable-like word count time series in nation-wide language data2019

    • 著者名/発表者名
      Hayafumi Watanabe
    • 学会等名
      Young Business and Industrial Statisticians Workshop on Recent Advances in Data Science and Business Analytics
    • 関連する報告書
      2019 実施状況報告書
    • 国際学会
  • [学会発表] Webの書き込みデータにみる数理構造と社会的な記憶―社会に十分定着した語は日々どのくらい変化しているか?―2019

    • 著者名/発表者名
      渡邊隼史
    • 学会等名
      計算社会科学とその周辺セミナー
    • 関連する報告書
      2019 実施状況報告書
    • 招待講演
  • [学会発表] Web不動産データを用いた空物件が入居されるまでの期間に関するデータ特性を考慮した統計モデリング2019

    • 著者名/発表者名
      渡邊 隼史, 一藤 裕, 鈴木 雅人, 山下 智志
    • 学会等名
      2019年度人工知能学会全国大会
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] Web不動産データを用いた空物件が入居されるまで期間の確率モデリング ―物件の特性からどこまで入居の予測が可能か?2019

    • 著者名/発表者名
      渡邊 隼史, 一藤 裕, 鈴木 雅人, 山下 智志
    • 学会等名
      第14回 Webインテリジェンスとインタラクション研究会
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] 時間付きテキスト上に観測される超慢拡散(対数拡散)2019

    • 著者名/発表者名
      渡邊隼史
    • 学会等名
      平成30年度統数研研究会「社会物理学の新展開」
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] Empirical observations of ultraslow diffusion in languages: Dynamical statistical properties of word counts of already popular words2018

    • 著者名/発表者名
      H. Watanabe
    • 学会等名
      Conference on Complex Systems 2018 (CCS 2018)
    • 関連する報告書
      2018 実施状況報告書
    • 国際学会
  • [学会発表] Multivariate analysis of the occupations of rental rooms by using the housing information web site data2018

    • 著者名/発表者名
      H. Watanabe and Yu Ichifuji and Masahito Suzuki and Satoshi Yamashita
    • 学会等名
      International Workshop on Data Science 2018
    • 関連する報告書
      2018 実施状況報告書
    • 国際学会
  • [学会発表] Web不動産データを用いた空物件が埋まる遷移に関する多変量解析2018

    • 著者名/発表者名
      渡邊 隼史 一藤 裕 鈴木 雅人 山下 智志
    • 学会等名
      2018年度人工知能学会全国大会
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] 大規模ブログデータベースを用いた食の流行の現状把握―ベンチャー企業での開発―2018

    • 著者名/発表者名
      渡邊隼史
    • 学会等名
      テキストマイニング 2018
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] 日本語のブログのおける形容詞の書き込み頻度時系列の確率的特性とイベントのインパクト計量への応用2018

    • 著者名/発表者名
      渡邊隼史
    • 学会等名
      日本行動計量学会 第46回大会
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] 十分社会に定着した単語の使用は日々どれくらいづつ変化してるか?-一国規模の単語使用頻度時系列における対数拡散-2018

    • 著者名/発表者名
      渡邊隼史
    • 学会等名
      経済・社会への分野横断的研究会
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] 様々な単語頻度時系列に共通して観測される対数的な拡散2018

    • 著者名/発表者名
      渡邊隼史
    • 学会等名
      第二回計算社会科学ワークショップ
    • 関連する報告書
      2017 実施状況報告書
  • [学会発表] ブログにおけるキーワードの書き込み時系列の物理学的観点での解析2017

    • 著者名/発表者名
      渡邊隼史,佐野幸恵,高安秀樹,高安美佐子
    • 学会等名
      計量国語学会第六十一回大会
    • 関連する報告書
      2017 実施状況報告書
  • [学会発表] ブログ上の形容詞時系列アンサンブルのランダム成分の特性を利用した一国規模の社会イベントのインパクトの計量2017

    • 著者名/発表者名
      渡邊 隼史
    • 学会等名
      統計関連学会連合大会
    • 関連する報告書
      2017 実施状況報告書
  • [学会発表] Statistical properties of fluctuations of time series representing appearances of words in nationwide blog data and their applications2017

    • 著者名/発表者名
      H. Watanabe, Y. Sano, H. Takayasu , M. Takayasu
    • 学会等名
      International Conference on Computational Social Science
    • 関連する報告書
      2017 実施状況報告書
    • 国際学会
  • [学会発表] The probability distributions and the fluctuation scalings of the time series of key-word counts in nation-wide blog data2017

    • 著者名/発表者名
      H. Watanabe, Y. Sano, H. Takayasu , M. Takayasu
    • 学会等名
      Econophysics Colloquium 2017
    • 関連する報告書
      2017 実施状況報告書
    • 国際学会
  • [学会発表] 具体例から考える”整っていない”大規模データの解析 -誤った解析を減らし,少しでも明瞭な結果を得るために-2017

    • 著者名/発表者名
      渡邊隼史
    • 学会等名
      ネットワーク科学セミナー2017統計数理研究所
    • 関連する報告書
      2017 実施状況報告書
    • 招待講演

URL: 

公開日: 2017-04-28   更新日: 2025-11-20  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi