• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 研究成果報告書

大規模ブログデータを用いた流行・普及現象の網羅的定量研究―新語時系列解析の応用―

研究課題

  • PDF
研究課題/領域番号 17K13815
研究種目

若手研究(B)

配分区分基金
研究分野 商学
研究機関金沢大学 (2018-2020)
統計数理研究所 (2017)

研究代表者

渡邊 隼史  金沢大学, 電子情報通信学系, 助教 (30783956)

研究期間 (年度) 2017-04-01 – 2021-03-31
キーワード時間付きテキストデータ / 大規模データ解析 / ソーシャルメディア解析 / 時系列解析 / 拡散現象 / 複雑システム科学 / 言語データ / 新聞データ
研究成果の概要

ブログや新聞等の時間付きデータにおける単語の使用の時間変化について研究を行った。本研究の一番の成果は,十分定着した語の単語使用数が対数関数的な速度で変化していることを明らかにしたことにある。この法則が日本語ブログだけなく,国内新聞や英語はフランス語のWikipediaでも共通して観測されることも示した。さらに理論研究により,社会的記憶との関係性も示唆した。また,新語普及についても,簡単な微分方程式にで多くの時間変化が統一的に説明できることを示唆し,論文化に向けて研究を進めている。さらに,明治大正昭和の新聞データに関する共同研究を開始し,独自フォーマットデータからpdfデータへの変換を完了した。

自由記述の分野

社会データ解析

研究成果の学術的意義や社会的意義

本研究の一番の主要成果である十分定着した語に関する対数関数的拡散現象の発見は,言語科学的には,言語の種類(日本語,フランス語,中国語,英語)や媒体(新聞,ブログ,Page view)に依存しない時間的な言語法則の新たな発見の可能性もある。また,物理学的には,理論的な研究はなれてきたが,現実の観測がほとんどなかったultra slow diffusion という現象の稀な現実観測例になっている。加えて,明治大正昭和の新聞データに関する言語OCR研究は,今後研究が順調に進み開発に成功すれば,社会学、言語学、情報科学など言語データを使う様々な分野で共通に使われる言語資源の提供につながる可能性もある。

URL: 

公開日: 2022-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi