• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

百年の時間付きテキストデータによる社会的忘却の研究-データの構築・解析・応用ー

研究課題

研究課題/領域番号 21K04529
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分25010:社会システム工学関連
研究機関成城大学

研究代表者

渡邊 隼史  成城大学, 経済学部, 准教授 (30783956)

研究期間 (年度) 2021-04-01 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2022年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
2021年度: 260千円 (直接経費: 200千円、間接経費: 60千円)
キーワード言語統計 / 時系列解析 / 普及現象 / 複雑系科学 / ロジスティック方程式 / 統計物理 / 新語 / 成長モデル / ゆらぎのスケーリング / 超慢拡散 / 複雑系 / ソーシャルメディアデータ / テキストデータ / ビッグデータ / 拡散現象 / 社会的記憶・忘却 / ソーシャルメディア分析 / 歴史新聞OCR / 計算社会科学 / 統計物理学
研究開始時の研究の概要

集団的な忘却現象の系統的な数量的法則の獲得とその実現のための観測データと観測法の整備も目的とする.具体的には以下の事項の研究を行う.
(1) 社会関心の忘却に関する数量的法則の探索と数理モデルによる記述
(2) 観測データとしての120年分の近代新聞画像データに関するOCR技術開発
(3) テキストから着目した事項に関する中長期の関心変化の信頼できる観測法の開発
手法は,データ解析及び数理モデル化(数十億記事の日本国内ブログデータや百年間新聞データ等の時間付きテキストデータの網羅的解析),及び,OCR等の情報科学的手法を用いる.長期的意思決定支援や人文社会科学研究への基礎データや手法提供を目指す.

研究実績の概要

本年度の主要な成果は論文が英国物理学会のJournal of Physics: Complexity 4 025018 (2023) から出版されたことにある。論文では,新語の普及現象の定量的な性質をよく記述できる数理モデルの提案を行った。具体的には,約2万語の新語について,日本中のブログの出現頻度や検索数の月次の時系列を網羅的に調査することで,「拡張ロジスティック方程式(古典的な普及現象の数理モデルであるロジスティック方程式に1パラメータを加えた拡張モデル)」で多様な成長曲線を体系的に説明できることを示した。加えてモデルの性質の統計解析により,Webでの言語拡散の最も典型的な成長曲線が,線形と指数関数の中間のパラメータを持つ曲線であり,普及現象の古典的な成長モデルであるロジスティック方程式に従う事例は多くは存在しないことを示した。また,成長の仕方とピークアウトの速度に関連性があることも示唆した。さらに,これらの性質は日本語だけでなく,英語,フランス語,スペイン語の言語でも成立することも明らかにした。本年度は,上記の論文成果の他,国際発表としては,統計物理学分野の国際会議でΣΦ2024発表を行った。加えて,国内学会では計算社会科学会でも発表を行った。
本年度の追加研究により,論文誌に発表した「拡張ロジスティック方程式」より,そのモデルを発展させた「区分べき乗モデル」のほうがより成長現象の本質を記述可能なことが明らかになりつつあるため,次年度はその事実をより深く追求していきたい。

現在までの達成度 (区分)
現在までの達成度 (区分)

4: 遅れている

理由

現状は,本研究の主目的の忘却現象の研究の前段階として研究することを予定していた「新語の普及現象の研究」に留まっているため遅延しているといえる。 遅延の理由は普及現象の解析に想定以上に時間がかかってしまっているためである。

今後の研究の推進方策

遅延のため研究計画の1年間の延長を行った。本年度は最終年度となるため,研究全体の方向性を修正し「新語の時間発展モデル」を完成させることに目標に置く。具体的には,(1)論文発表済みの「拡張ロジスティック方程式モデル」からより多様な現象をシンプルに記述できる「区分べき乗モデル」に発展させ,その性質を検証すること,(2)マクロな新語の書き込み数ベースの集計とミクロな新語を知った人ベースの集計の相違を解析することで成長曲線のミクロベースの詳細を明らかにすること,(3)べき乗モデルのべき乗パラメータの定性的な意味を明らかにすること,の3点を目標にし論文成果化につなげたい。

報告書

(3件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 2021 実施状況報告書
  • 研究成果

    (6件)

すべて 2024 2023 2022 2021

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 1件) 学会発表 (4件) (うち国際学会 1件、 招待講演 1件)

  • [雑誌論文] Minor extensions of the logistic equation for growth curves of word counts on online media: parametric observation of diversity of growth in society2023

    • 著者名/発表者名
      Watanabe Hayafumi
    • 雑誌名

      Journal of Physics: Complexity

      巻: 4 号: 2 ページ: 025018-025018

    • DOI

      10.1088/2632-072x/acda72

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Relations between anomalous diffusion and fluctuation scaling: the case of ultraslow diffusion and time-scale-independent fluctuation scaling in language2021

    • 著者名/発表者名
      Watanabe Hayafumi
    • 雑誌名

      The European Physical Journal B

      巻: 94 号: 11 ページ: 1-26

    • DOI

      10.1140/epjb/s10051-021-00236-2

    • 関連する報告書
      2021 実施状況報告書
    • 査読あり
  • [学会発表] ブログにおける新語の単語カウントの成長現象の網羅的解析と成長時系列のモデル化2024

    • 著者名/発表者名
      渡邊隼史
    • 学会等名
      第3回 計算社会科学会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] Empirical observations of ultraslow diffusion driven by the fractional dynamics in languages: Fluctuation and dynamical properties of word counts of already popular words2023

    • 著者名/発表者名
      Hayafumi Watanabe
    • 学会等名
      International conference on statistical physics 2023
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] オンライン言語現象における最も典型的な普及曲線はどのような形状か?―社会における普及現象の多様性の解析とそのモデル化ー2022

    • 著者名/発表者名
      渡邊隼史
    • 学会等名
      第2回計算社会学会
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 複雑系科学の視点でみる時間付きテキストデータにみられる数理十分安定した言葉の安定性の数理解析を例に2021

    • 著者名/発表者名
      渡邊隼史
    • 学会等名
      ネットワーク科学談話会
    • 関連する報告書
      2021 実施状況報告書
    • 招待講演

URL: 

公開日: 2021-04-28   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi