研究課題/領域番号 |
18K00627
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分02070:日本語学関連
|
研究機関 | 同志社大学 |
研究代表者 |
金 明哲 同志社大学, 文化情報学部, 教授 (60275469)
|
研究分担者 |
山崎 誠 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 教授 (30182489)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2019年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2018年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | 文体の変化 / モデリング / テキストマイニング / 助詞 / 文末パターン / 文体変化 / コーパス作成 / 正則化回帰 / ランダムフォレスト / コーパス / テキストアナリシス / 計量文献学 / 文体 / データサイエンス / 文体分析 |
研究成果の概要 |
本研究では,まず,100年以上にわたる膨大な小説の中から,毎年5~6人の代表的な作家の作品をサンプリングし,592人の作家による592編の小説(9557078文字)のコーパスを作成した。次に、コーパスに対して形態素解析と構文解析を行い、文体の特徴を分析した。分析は,教師なしの方法を用いて文体の特徴について概観したうえで,教師ありの学習方法で時間に伴って変化が顕著である変数を特定し,モデリングを行った.その結果,助詞や文末パターンには経年によって顕著に増減していることが明らかにされ,これらに対して言語学や文体学の視点で解釈を試みた.
|
研究成果の学術的意義や社会的意義 |
本研究では,日本語の現代文における文体および言語の経時的変化について機械学習やモデリングなどのデータサイエンスの手法で変化の要素を明らかにすると同時に,その現象の裏に潜んでいる要因を社会学,文体学,言語学の視点で究明を試みた.本研究の成果は,日本語文体および言語学の研究などに有益な学問的情報を提供するだけではなく,現代社会における人文社会科学の研究にデータサイエンスの方法を用いる有効性を示すに値する.
|