2021 年度実績報告書

深層学習による平安時代日本語語彙のジェンダー性の研究

研究課題

研究課題/領域番号	19K00629
研究機関	青山学院大学
研究代表者	近藤泰弘青山学院大学, 文学部, 教授 (20126064)
研究期間 (年度)	2019-04-01 – 2022-03-31
キーワード	コーパス / 深層学習 / 機械学習 / word2vec / ジェンダー / 敬語
研究実績の概要	今回の研究においては、平安時代語のデータベースを作成し、そのデータを元に深層学習を応用して、ジェンダーに関する語の分布や文体についての研究を行うことを意図した。平安時代語のデータベースは、国立国語研究所の日本語歴史コーパス（CHJ)の原データを用い、それが保存されているSQLデータベースから引き出したデータを再構成した。それによって得られた資料を、手元のジェンダー性によって学習させ、それでその他のデータを深層学習によって分類した。また、深層学習を用いて単語分散表現を算出できるword2vecを用いて、ベクトル化した数値を求め、その数値のベクトルを次元圧縮することで、多くの情報を得ることができた。それによって、得た結果を用いて、平安時代語形容詞の分類を行い、ジェンダー性によって「シク活用形容詞」の分布が異なっていることを示すことができた。また、平安時代語の敬語の分布について、男女の違いがあること、また、文の長さなどと関係性があることなどを示すことができた。また、平安時代語の敬語が、地の文で使われることについては、平安時代語の資料が文学作品であり、「語り」という性格を持っているために、現代語とは異なった状況を示していることも合わせて論証した。また、和歌の文体では、逆に敬語がまったく用いられないが、これは、和歌の文体が「語り」とは無関係であり、空間ダイクシスにも欠けるものであることと深い関係があることを示した。ジェンダー的な性格についても、これらの体系の中で考えていくことが必要である。なお、これらの成果の一部は、近藤泰弘・澤田淳『敬語の文法と語用論』（開拓社）に収めた論文の中で公開している。

研究成果
(4件)

すべて 2022 その他

すべて雑誌論文 (1件) 学会発表 (1件) 図書 (1件) 備考 (1件)

[雑誌論文] 明治元訳新約聖書の諸本の系統と文体2022
- 著者名/発表者名
  近藤泰弘
- 雑誌名
  
  国語と国文学
  
  巻: 99 ページ: 3-20
[学会発表] パラレルコーパスとしての明治元訳新約聖書の分析2022
- 著者名/発表者名
  近藤泰弘
- 学会等名
  国立国語研究所通時コーパスシンポジウム
[図書] 敬語の文法と語用論2022
- 著者名/発表者名
  近藤泰弘・澤田淳
- 総ページ数
  434
- 出版者
  開拓社
- ISBN
  978-4-7589-2360-6
[備考] 日本語・日本文学研究の未来のために
- URL
  http://www.japanese.gr.jp