研究課題/領域番号 |
17K13815
|
研究種目 |
若手研究(B)
|
配分区分 | 基金 |
研究分野 |
商学
|
研究機関 | 金沢大学 (2018-2020) 統計数理研究所 (2017) |
研究代表者 |
渡邊 隼史 金沢大学, 電子情報通信学系, 助教 (30783956)
|
研究期間 (年度) |
2017-04-01 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2019年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2018年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2017年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
|
キーワード | 時間付きテキストデータ / 大規模データ解析 / ソーシャルメディア解析 / 時系列解析 / 拡散現象 / 複雑システム科学 / 言語データ / 新聞データ / 普及 / 新語 / 時系列データ / 時間発展方程式 / 歴史新聞データ / OCR / 統計物理 / 普及現象 / ブログ解析 / 新語の定着 / 関連語 / SNS解析 / 文書長 / 超慢拡散 / 長期記憶 / 社会的記憶 / 非整数微積分 / SNSデータ / 新聞記事 / 流行解析 / Ultraslow diffusion / 複雑系 / 計算社会学 / 統計物理学 / マーケティング / ソーシャルメディア / 統計科学・社会データ解析 |
研究成果の概要 |
ブログや新聞等の時間付きデータにおける単語の使用の時間変化について研究を行った。本研究の一番の成果は,十分定着した語の単語使用数が対数関数的な速度で変化していることを明らかにしたことにある。この法則が日本語ブログだけなく,国内新聞や英語はフランス語のWikipediaでも共通して観測されることも示した。さらに理論研究により,社会的記憶との関係性も示唆した。また,新語普及についても,簡単な微分方程式にで多くの時間変化が統一的に説明できることを示唆し,論文化に向けて研究を進めている。さらに,明治大正昭和の新聞データに関する共同研究を開始し,独自フォーマットデータからpdfデータへの変換を完了した。
|
研究成果の学術的意義や社会的意義 |
本研究の一番の主要成果である十分定着した語に関する対数関数的拡散現象の発見は,言語科学的には,言語の種類(日本語,フランス語,中国語,英語)や媒体(新聞,ブログ,Page view)に依存しない時間的な言語法則の新たな発見の可能性もある。また,物理学的には,理論的な研究はなれてきたが,現実の観測がほとんどなかったultra slow diffusion という現象の稀な現実観測例になっている。加えて,明治大正昭和の新聞データに関する言語OCR研究は,今後研究が順調に進み開発に成功すれば,社会学、言語学、情報科学など言語データを使う様々な分野で共通に使われる言語資源の提供につながる可能性もある。
|