• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Annual Research Report

日本語の文章における漢字使用の実態を解明するための近現代小説コーパスの構築

Research Project

Project/Area Number 22K19985
Research InstitutionUniversity of Tsukuba

Principal Investigator

菅野 倫匡  筑波大学, 人文社会系, 助教 (30961651)

Project Period (FY) 2022-08-31 – 2024-03-31
Keywords表記 / 漢字使用の実態 / 芥川賞作品 / コーパス
Outline of Annual Research Achievements

本研究の目的は日本語の文章における漢字使用の実態を通時的・計量的な観点から明らかにするために日本語の表記や語彙の研究に資する近現代小説コーパスとして芥川龍之介賞受賞作品(芥川賞作品)のコーパスを構築することである。この目的の達成に向けて今年度は実際に芥川賞作品のコーパスを構築する作業を継続すると共にコーパスを構築する方法論の整備にも取り組むこととした。
まず,昨年度に引き続いてコーパスを構築する作業を進めた。特に21世紀以降の新しい作品に重点を置き,対象とする本文を電子化した上で各語に分割して語種(和語・漢語・外来語)や品詞などの情報を認定する作業を実施した。なお,今年度は作業補助者を追加で募集し,作業を迅速に進められるように努めた。また,作業を進めるに当たっては昨年度に定めた作業用のマニュアルを作業補助者と事前に共有し,全体として一貫した処理になるように留意した。
次にコーパスを構築する方法論の整備を試みた。具体的には芥川賞作品のコーパスを構築するために考案した作業の手順について古典語のコーパスを構築する事例に適用し,その汎用性の高さを実証的に示した。また,既存のコーパスとの互換性に配慮したデータの管理方法や用例の検索方法についても昨年度に引き続いて検討し,その一部についてプログラミング言語Pythonを用いて実装した。更に両者の成果を合わせて研究発表を実施した。
研究期間全体を通しては実際に芥川賞作品のコーパスを構築する作業に取り組んだことに加え,コーパスを構築するに当たって生じ得る問題を整理した上で一定の解決を見込める手順を提示したことやコーパスを構築する作業を進めるに当たって汎用性の高い手順を考案したことが本研究の中心的な成果であると言える。また,これはコーパスに基づいて日本語の文章における漢字使用の実態を明らかにするための一助となるものである。

  • Research Products

    (1 results)

All 2023

All Presentation (1 results)

  • [Presentation] 中古和文資料『夜の寝覚』のコーパス構築の試み2023

    • Author(s)
      菊池そのみ・菅野倫匡
    • Organizer
      言語資源ワークショップ2023

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi