• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Research-status Report

新語彙定着期の言語変化―コーパスに基づく通時的語彙研究の実践

Research Project

Project/Area Number 20K13060
Research InstitutionWayo Women's University

Principal Investigator

間淵 洋子  和洋女子大学, 人文学部, 准教授 (10415614)

Project Period (FY) 2020-04-01 – 2023-03-31
Keywords日本語史 / コーパス / 新語彙 / 言語変化 / 近代漢語 / 通時研究
Outline of Annual Research Achievements

本研究は、日本語史上語彙変化の大きかった時期に、新たに用いられるようになった語彙(新語彙)が、どのような過程で定着するかを、大規模コーパス(言語研究用の言語データベース)を用いて計量的・実証的に明らかにすることを通して、言語変化メカニズムの一端を解明することを目指すものである。
2年目となる2021年度は、前年度に本文の文字入力作業を実施した、科学・思想を主とする分野の啓蒙的資料(翻訳を含む教科書・論文・雑誌記事など)のテキストデータに対して、形態論情報(単語情報)付与に向けてデータ整備を行なった。具体的には、形態素解析用のデータクリーニングに加え、文体(文語体か口語体か)や表記体(漢字カタカナ交じり文か漢字ひらがな交じり文か)などを含めてテキストの構造をタグづけしXMLによる構造化テキストを構築した。
また、昨年度に引き続き、既存コーパスの語彙調査を進め、新語彙の抽出と実態の確認を行なった。特に、明治から平成にかけての雑誌コーパス(『日本語歴史コーパス 明治・大正編Ⅰ雑誌』と、現在構築中の昭和・平成期の雑誌コーパス、『現代日本語書き言葉均衡コーパス』の「生産実態サブコーパス・雑誌」レジスター)を調査対象として、そこに見られる語形の揺れ(特に、「簡単」「単簡」のように、字順が入れ替わった形式による語形のバリエーション)と収束・統一に関する研究を中心的に行なった。研究結果は、研究発表会 「昭和・平成書き言葉コーパスによる近現代日本語の実証的研究」において報告した。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

2021年度は、データ構築とコーパスに対する語彙調査を並行して行なった。
調査に関しては、既存資料に対する調査について順調に進めることができたが、データ構築については思うように進めることができず、当初予定からはやや遅れていると判断する。
データ構築については、前年度にテキスト入力を実施した啓蒙的資料のデータ整形(形態素解析のためのデータクリーニング)後に、形態素解析とその整備までを進める予定であったが、研究代表者の所属変更とこれに伴う大幅な業務内容・形態の変更により、これらの作業を思うように進めることができなかった。

Strategy for Future Research Activity

最終年度となる2022年度は、引き続き、既存コーパスで不足している資料のコーパス化を進める。2021年度にテキストの整備を実施した近代啓蒙資料については、形態素解析を実施し、作業補助者を得て形態論情報を整備する。戦前・戦後期の新聞についてもコーパス化のため、新聞紙面の文字入力、データ整形、形態素解析、形態論情報整備を順次進める。
また、既に実施中の既存コーパスにおける新語彙の抽出と使用実態の通時的調査に加え、新たに追加した資料についても同様に語彙調査を行う。
これらの語彙調査を通じて、明治期、戦後を中心にとして新語彙が出現し定着していく過程を、言語計量の手法に基づき客観的に示す。

Causes of Carryover

2021年度は、戦前・戦後の新聞データの入力業務と近代啓蒙資料の形態論情報整備を実施する予定であったが、所属機関の変更と、これに伴う業務の大幅な変更などにより、予定のデータ整備をスムーズに進めることができず、このために計上していた予算額を使用することができなかった。
最終年度となる2022年度は、すでにテキスト入力を外部業者へ発注するための準備の済んでいる、戦前・戦後の新聞データの入力を実施し、作業補助者の確保が済んでいる近代啓蒙資料の形態論情報整備を早急に進める(次年度使用額を充当)。また、これによる入力データが納品され次第、戦前・戦後の新聞データに対する形態論情報整備を進める(2022年度配当額を充当)

  • Research Products

    (2 results)

All 2021

All Presentation (1 results) Book (1 results)

  • [Presentation] 字順転倒漢語の語形交替について2021

    • Author(s)
      間淵洋子
    • Organizer
      研究発表会 「昭和・平成書き言葉コーパスによる近現代日本語の実証的研究」
  • [Book] コーパスによる日本語史研究 近代編2021

    • Author(s)
      田中牧郎・橋本行洋・小木曽智信
    • Total Pages
      375
    • Publisher
      ひつじ書房
    • ISBN
      978-4-8234-1097-0

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi