• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 研究成果報告書

データサイエンスに基づいた日本文体変化分析とその構造のモデリング

研究課題

  • PDF
研究課題/領域番号 18K00627
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分02070:日本語学関連
研究機関同志社大学

研究代表者

金 明哲  同志社大学, 文化情報学部, 教授 (60275469)

研究分担者 山崎 誠  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 教授 (30182489)
研究期間 (年度) 2018-04-01 – 2021-03-31
キーワード文体の変化 / モデリング / テキストマイニング / 助詞 / 文末パターン
研究成果の概要

本研究では,まず,100年以上にわたる膨大な小説の中から,毎年5~6人の代表的な作家の作品をサンプリングし,592人の作家による592編の小説(9557078文字)のコーパスを作成した。次に、コーパスに対して形態素解析と構文解析を行い、文体の特徴を分析した。分析は,教師なしの方法を用いて文体の特徴について概観したうえで,教師ありの学習方法で時間に伴って変化が顕著である変数を特定し,モデリングを行った.その結果,助詞や文末パターンには経年によって顕著に増減していることが明らかにされ,これらに対して言語学や文体学の視点で解釈を試みた.

自由記述の分野

計量言語学,計量文体学,テキストマイニング

研究成果の学術的意義や社会的意義

本研究では,日本語の現代文における文体および言語の経時的変化について機械学習やモデリングなどのデータサイエンスの手法で変化の要素を明らかにすると同時に,その現象の裏に潜んでいる要因を社会学,文体学,言語学の視点で究明を試みた.本研究の成果は,日本語文体および言語学の研究などに有益な学問的情報を提供するだけではなく,現代社会における人文社会科学の研究にデータサイエンスの方法を用いる有効性を示すに値する.

URL: 

公開日: 2022-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi