• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Research-status Report

新語彙定着期の言語変化―コーパスに基づく通時的語彙研究の実践

Research Project

Project/Area Number 20K13060
Research InstitutionNational Institute for Japanese Language and Linguistics

Principal Investigator

間淵 洋子  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 特任助教 (10415614)

Project Period (FY) 2020-04-01 – 2023-03-31
Keywordsコーパス / 新語彙 / 言語変化 / 通時研究 / 日本語史 / 近代漢語
Outline of Annual Research Achievements

本研究は、日本語史上語彙変化の大きかった時期に、新たに用いられるようになった語彙(新語彙)が、どのような過程で定着するかを、大規模コーパス(言語研究用の言語データベース)を用いて計量的・実証的に明らかにすることを通して、言語変化メカニズムの一端を解明することを目指すものである。
初年度となる2020年度は、既に予備調査により語彙変化の大きかったことが分かっている幕末・明治期を対象として、調査対象コーパスの一部となる新コーパス(既存コーパスを補完するための新たなコーパス)の構築に取り組んだ。特に、科学・思想を主とする分野の啓蒙的資料(翻訳を含む教科書・論文・雑誌記事など)のコーパス化に向けての作業を進めた。
具体的には、資料(『明治文学全集 3 明治啓蒙思想集』大久保利謙編、筑摩書房、1967年)の入手、電子化を経て、専門業者に依頼し本文の文字入力を行なった。合わせて、同様に新コーパスとなる戦前・戦後期の新聞のコーパスを作成する準備として、資料収集を試みた。
また、既存コーパスの言語調査についても一部を実施した。明治から平成にかけての雑誌コーパス(『日本語歴史コーパス 明治・大正編Ⅰ雑誌』、現在構築中の昭和・平成期の雑誌コーパス、『現代日本語書き言葉均衡コーパス』の「生産実態サブコーパス・雑誌」レジスター)を調査対象として、そこに見られる語彙変化・語義変化について研究を行なった。研究結果は、言語処理学会第27回年次大会において報告した。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

初年度となる2020年度は、当初予定通り、既存のコーパスでは不足する資料のコーパス化に取り組んだ。幕末・明治期の科学・思想を主とする分野の啓蒙的資料として、『明治文学全集 3 明治啓蒙思想集』(大久保利謙編、筑摩書房、1967年)を選定し、資料の電子化および本文文字入力を実施した。また、合わせて戦前戦後期の『読売新聞』の本文入力および整備、『毎日新聞』の本文入力の準備を行なった。
当初予定では、入力を終えた本文は、作業補助者の協力を得て形態素解析用に整備することになっていたが、新型コロナ感染症の感染拡大の影響で、専門業者への入力発注作業や、納品物の確認作業などの滞りがあったこと、また、作業補助者を十分に確保できなかったため、データ整備が進められなかったこと、図書館等の利用制限などがあり、入力対象資料の入手も困難であったこと、といった複数の要因により、進捗状況はやや遅れている。

Strategy for Future Research Activity

2年目となる2021年度は、引き続き、既存コーパスで不足している資料のコーパス化を進める。
既に2020年度にデータ入力が終わっている資料については、形式の整備を行なった上で、形態素解析を実施し、形態論情報を整備する。作業補助者の確保が課題になるが、SNSを使った募集など、新しい方法を取り入れて人員不足の解消を試みる。
合わせて、戦前・戦後期の新聞についてもコーパス化の作業を進める。

Causes of Carryover

新型コロナウィルス感染症の感染拡大により、学会や研究会の参加に係る旅費の執行は一切できなかった。
これらは、作業補助者の確保が十分に行えず進められなかった、形態論情報揖斐作業に充当する。

  • Research Products

    (1 results)

All 2021

All Presentation (1 results)

  • [Presentation] 近現代日本語の意味変化分析のための単語データセット構築の試み2021

    • Author(s)
      間淵洋子・小木曽智信
    • Organizer
      言語処理学会第27回年次大会(NLP2021)

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi