• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Annual Research Report

昭和・平成書き言葉コーパスによる近現代日本語の実証的研究

Research Project

Project/Area Number 19H00531
Research InstitutionNational Institute for Japanese Language and Linguistics

Principal Investigator

小木曽 智信  大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 教授 (20337489)

Co-Investigator(Kenkyū-buntansha) 小椋 秀樹  立命館大学, 文学部, 教授 (00321547)
間淵 洋子  和洋女子大学, 人文学部, 准教授 (10415614)
高橋 雄太  明治大学, 国際日本学部, 助教 (20840193)
近藤 明日子  東京大学, 大学院人文社会系研究科(文学部), 助教 (30425722)
松田 謙次郎  神戸松蔭女子学院大学, 文学部, 教授 (40263636)
永澤 済  上智大学, 言語教育研究センター, 准教授 (50613882)
持橋 大地  統計数理研究所, 数理・推論研究系, 准教授 (80418508)
田中 牧郎  明治大学, 国際日本学部, 専任教授 (90217076)
金 愛蘭  日本大学, 文理学部, 准教授 (90466227)
小町 守  東京都立大学, システムデザイン研究科, 教授 (60581329)
Project Period (FY) 2019-04-01 – 2023-03-31
Keywordsコーパス / 日本語史 / 言語変化 / 形態論情報 / 近現代語 / 言語資源 / 自然言語処理
Outline of Annual Research Achievements

コーパス構築班では、予定通りコーパスの整備を終え、『昭和・平成書き言葉コーパス』を構築しオンラインで公開した。このコーパスは日本語の歴史的変化を研究するための基礎資料として昭和・平成期の雑誌・ベストセラー書籍・新聞を収録したもので、1933年から 2013年までの間を8年おきに11か年分,合計約3,340万語を収録した大規模なものである。明治・大正期までの『日本語歴史コーパス』の後をうけ、現代に至るまでの日本語の成り立ちを探ることのできる資料として、日本語研究に重要な役割を果たすことが期待される。全文にUniDicによる短単位情報が付与されており『日本語歴史コーパス』や『現代日本語書き言葉均衡コーパス』と比較対照した研究が可能となった。
公開にあたっては、平成30年に改正された著作権法の柔軟な権利制限規定にもとづき表示される文脈長を制限するなどの条件の下で著作者の許諾を得ることなく、弁護士への確認を経て適法な形に公開している。コーパス検索アプリケーション「中納言」上で、検索サービスとして公開するほか、語彙表頻度表などの統計情報も公開する。
コーパス活用班では、コーパス研究会を3回開き、開発中のコーパスを用いた近現代日本語の表記・語彙・文法に関する研究の成果発表を行って、一部を研究論文として刊行した。

Research Progress Status

令和4年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

令和4年度が最終年度であるため、記入しない。

  • Research Products

    (13 results)

All 2023 2022 Other

All Journal Article (4 results) (of which Peer Reviewed: 4 results,  Open Access: 2 results) Presentation (7 results) (of which Int'l Joint Research: 1 results) Remarks (2 results)

  • [Journal Article] 明治期から平成期における接頭辞「非-」の変遷2023

    • Author(s)
      小椋秀樹
    • Journal Title

      国語語彙史の研究

      Volume: 42 Pages: 左97-左116

    • Peer Reviewed
  • [Journal Article] 異なる時期での意味の違いを捉える単語分散表現の結合学習2023

    • Author(s)
      相田太一, 小町守, 小木曽智信, 高村大也, 持橋大地
    • Journal Title

      自然言語処理

      Volume: 30 Pages: -

    • Peer Reviewed / Open Access
  • [Journal Article] BERTを用いた日本語の意味変化の分析2023

    • Author(s)
      小林千真, 相田太一, 岡照晃, 小町守
    • Journal Title

      自然言語処理

      Volume: 30 Pages: -

    • Peer Reviewed / Open Access
  • [Journal Article] 近現代における副詞の仮名表記化2022

    • Author(s)
      髙橋雄太
    • Journal Title

      論究日本近代語

      Volume: 第二集 Pages: 221-234

    • Peer Reviewed
  • [Presentation] 『日本語歴史コーパス』ver.2023.3通時コーパス拡張進捗報告2023

    • Author(s)
      小木曽智信
    • Organizer
      「通時コーパス」シンポジウム2023
  • [Presentation] トピックモデルを用いた単語の通時的な意味変化のモデル化とその応用2023

    • Author(s)
      井上誠一
    • Organizer
      「通時コーパス」シンポジウム2023
  • [Presentation] 『昭和・平成書き言葉コーパス』と権利処理2023

    • Author(s)
      小木曽智信
    • Organizer
      「通時コーパス」シンポジウム2023
  • [Presentation] 日本語史における和語2022

    • Author(s)
      田中牧郞
    • Organizer
      第62回 語彙・辞書研究会
  • [Presentation] 日本語語彙の近代化における外来要素の受容と調整2022

    • Author(s)
      田中牧郞
    • Organizer
      日本歴史言語学会
  • [Presentation] Infinite SCAN: An Infinite Model of Diachronic Semantic Change2022

    • Author(s)
      Seiichi Inoue, Mamoru Komachi, Toshinobu Ogiso, Hiroya Takamura and Daichi Mochihashi
    • Organizer
      The 2022 Conference on Empirical Methods in Natural Language Processing (EMNLP 2022)
    • Int'l Joint Research
  • [Presentation] 開かれた言語資源の共同構築と活用に向けて―新しい「通時コーパス」プロジェクトと「語彙資源」プロジェクト―2022

    • Author(s)
      小木曽智信
    • Organizer
      NINJALシンポジウム「言語資源学の創成 : 開かれた言語資源による日本語研究」
  • [Remarks] 『昭和・平成書き言葉コーパス』

    • URL

      https://clrd.ninjal.ac.jp/shc/

  • [Remarks] コーパス検索アプリケーション「中納言」昭和・平成書き言葉コーパス

    • URL

      https://chunagon.ninjal.ac.jp/shc

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi