研究課題/領域番号 |
21K04529
|
研究機関 | 成城大学 |
研究代表者 |
渡邊 隼史 成城大学, 経済学部, 准教授 (30783956)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 言語統計 / 統計物理 / 新語 / 時系列解析 / 成長モデル / ロジスティック方程式 |
研究実績の概要 |
今年度の主要な成果は「新語の時間発展を記述する数理モデル」の論文化を行ったことである。 論文は,現在査読中であり https://arxiv.org/abs/2211.16733 に公開済みである。具体的には,多様なパターンがあるソーシャルメディアにおける新語の書き込み頻度の時間発展をロジスティック方程式に1変数加えたシンプルな数理モデルで体系的に記述でることを示したことが主要な成果である。また,この結果は,日本語のブログデータ(主要な研究データ)だけでなく,英語,フランス語,スペイン語,日本語のGoogleの検索頻度の時系列にも適応可能であることも示した。さらに,モデルのパラメータ解析により,最も典型的な成長パタンは,初期に指数関数で成長し,その後,時間の2乗にべき乗に漸近するような成長曲線(線形プロットでは「ノ」の字型,対数プロットでは「r」の字型による成長曲線)であることを明らかにした。これは様々な分野の典型的な成長曲線であるロジスティック曲線(S字曲線)とは異なる曲線である。加えて,モデルパラメータ(成長曲線の形状)とピークアウトの速度に関係性があることも明らかにした。この成果は,物理学的には複雑システムにおける普及や成長現象の観測研究,言語学には新語の普及の研究,また,応用的には,マーケティング等の「流行の解析や予測」のための基礎的な知見に位置づけられると考えられる。 この言語データ研究に加えて,複数の大規模データを組みあわせる研究として,Webの賃貸物件の空室と現地調査との関係に関する研究についても論文化し現在査読中である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
進捗は,本研究の主題である「忘却現象」の前段階である「新語の普及の研究」に留まっており遅延しているといえる。しかし,新語が流行のピークを終えた後のピークアウトに関連する忘却現象(緩和現象)について,主テーマと直接的に関連する新たな量的な法則を発見できており,それは進展といえる。この成果は,新語以外の「十分定着した語」とも忘却に関する整合性のある性質であり,この発見は,テキストデータから観測される社会的忘却の総合的な理解のための助けになるものと考えられる。
|
今後の研究の推進方策 |
昨年に続き,社会の忘却研究とそれに関連する新語の普及の研究を確実に進めていく。第一に,新語の普及について,今年度の研究によって残された問題―(1)パラメータの冗長性 (2)予測能力―の2点についてあきらかにし,その論文化を行う。第2に,社会的な忘却についての着目する「歴史的忘却に関するキーワード」リストの作成の研究とデータ収集を行う。さらに,できれば,2022年に公開された,国立国会図書館のNグラムデータについて利用についてなんらかのアクションを行いたい。 第3に,データ整備として,古新聞画像データについては、2022年に公開された国立国会図書館のNDL-OCRライブラリの利用の模索し,テキストデータ化に近づける。また,平成新聞データについては,全文検索データベース作成など今後の研究で利用しやすい形式への整備を行いたい。
|
次年度使用額が生じた理由 |
研究が遅延しているため出費が計画より遅くなっている。そのため,来年度に1年の研究期間を延長を申請する予定である。
|