• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

昭和・平成書き言葉コーパスによる近現代日本語の実証的研究

研究課題

研究課題/領域番号 19H00531
研究種目

基盤研究(A)

配分区分補助金
応募区分一般
審査区分 中区分2:文学、言語学およびその関連分野
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

小木曽 智信  大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 教授 (20337489)

研究分担者 小椋 秀樹  立命館大学, 文学部, 教授 (00321547)
間淵 洋子  和洋女子大学, 人文学部, 准教授 (10415614)
高橋 雄太  明治大学, 国際日本学部, 助教 (20840193)
近藤 明日子  東京大学, 大学院人文社会系研究科(文学部), 助教 (30425722)
松田 謙次郎  神戸松蔭女子学院大学, 文学部, 教授 (40263636)
永澤 済  上智大学, 言語教育研究センター, 准教授 (50613882)
持橋 大地  統計数理研究所, 数理・推論研究系, 准教授 (80418508)
田中 牧郎  明治大学, 国際日本学部, 専任教授 (90217076)
金 愛蘭  日本大学, 文理学部, 准教授 (90466227)
小町 守  東京都立大学, システムデザイン研究科, 教授 (60581329)
研究期間 (年度) 2019-04-01 – 2023-03-31
研究課題ステータス 完了 (2022年度)
配分額 *注記
44,850千円 (直接経費: 34,500千円、間接経費: 10,350千円)
2022年度: 9,490千円 (直接経費: 7,300千円、間接経費: 2,190千円)
2021年度: 11,960千円 (直接経費: 9,200千円、間接経費: 2,760千円)
2020年度: 11,960千円 (直接経費: 9,200千円、間接経費: 2,760千円)
2019年度: 11,440千円 (直接経費: 8,800千円、間接経費: 2,640千円)
キーワードコーパス / 日本語史 / 言語変化 / 形態論情報 / 近現代語 / 言語資源 / 自然言語処理 / 日本語学 / 表記 / 語彙 / 語法
研究開始時の研究の概要

日本語の実証的研究にとってコーパスは欠かせないものとなっているが、既存のコーパスでは昭和期以降の書き言葉のコーパスが不足しているため、明治から現代までの日本語の変化を通時的に研究することが困難である。そこで本研究では「昭和・平成書き言葉コーパス」を構築して、明治以降約150年の日本語の長期的な変化の研究を可能にする。そして、このコーパスを活用して、語彙・文法・表記・国語政策等の各分野においてコーパスにもとづいた実証的な研究を行う。また、新しい統計的な手法による言語変化のモデル化に取り組む。完成したコーパスは改正著作権法に従いインターネット上の検索サービスとして一般公開する。

研究成果の概要

昭和・平成期の雑誌・ベストセラー書籍・新聞を収録した『昭和・平成書き言葉コーパス』を構築し、国立国語研究所のコーパス検索アプリケーション「中納言」を通してオンラインで公開した。このコーパスは1933年から2013年までの間を8年おきに11か年分,合計約3,340万語収録した大規模なものである。明治・大正期までの『日本語歴史コーパス』の後を承けて、現代に至るまでの日本語の成り立ちを探ることのできる資料として、日本語研究に重要な役割を果たすことが期待される。本研究課題では、このコーパスを活用した日本語史研究も実施し、研究発表会・論文を通して成果を発表した。

研究成果の学術的意義や社会的意義

本研究課題で構築・公開された『昭和・平成書き言葉コーパス』は、従来欠けていた昭和・平成期の大規模な日本語研究用資料として、今後の日本語研究において重要な役割を果たすことが期待される。本コーパスを『日本語歴史コーパス』に接続することで、上代から現代までの日本語を通時的に、実証的に研究する環境が初めて整った。また、本コーパスから得られる語彙統計情報は、国語辞典編纂・自然言語処理などの分野でも活用されることが期待される。

報告書

(6件)
  • 2022 実績報告書   研究成果報告書 ( PDF )
  • 2021 実績報告書
  • 2020 実績報告書
  • 2019 審査結果の所見   実績報告書
  • 研究成果

    (38件)

すべて 2023 2022 2021 2020 2019 その他

すべて 雑誌論文 (11件) (うち査読あり 8件、 オープンアクセス 3件) 学会発表 (24件) (うち国際学会 1件) 備考 (3件)

  • [雑誌論文] 明治期から平成期における接頭辞「非-」の変遷2023

    • 著者名/発表者名
      小椋秀樹
    • 雑誌名

      国語語彙史の研究

      巻: 42

    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [雑誌論文] 異なる時期での意味の違いを捉える単語分散表現の結合学習2023

    • 著者名/発表者名
      相田太一, 小町守, 小木曽智信, 高村大也, 持橋大地
    • 雑誌名

      自然言語処理

      巻: 30

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] BERTを用いた日本語の意味変化の分析2023

    • 著者名/発表者名
      小林千真, 相田太一, 岡照晃, 小町守
    • 雑誌名

      自然言語処理

      巻: 30

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 近現代における副詞の仮名表記化2022

    • 著者名/発表者名
      髙橋雄太
    • 雑誌名

      論究日本近代語

      巻: 第二集 ページ: 221-234

    • 関連する報告書
      2022 実績報告書 2021 実績報告書
    • 査読あり
  • [雑誌論文] 新漢字と旧漢字が混在したテキストからの短単位形態素の抽出について2021

    • 著者名/発表者名
      松田謙次郎
    • 雑誌名

      国立国語研究所論集 = NINJAL Research Papers

      巻: 21 号: 21 ページ: 123-132

    • DOI

      10.15084/00003440

    • NAID

      120007116735

    • ISSN
      2186-1358
    • URL

      https://repository.ninjal.ac.jp/records/3457

    • 関連する報告書
      2021 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 明治・大正期における否定の字音接頭辞 ―「非」を中心に―2021

    • 著者名/発表者名
      小椋秀樹
    • 雑誌名

      国語語彙史の研究

      巻: 40 ページ: 208-189

    • 関連する報告書
      2021 実績報告書
    • 査読あり
  • [雑誌論文] 「Xノタメニ」受身文の残存と衰退:近現代コーパスからみる2021

    • 著者名/発表者名
      永澤済
    • 雑誌名

      日本語文法

      巻: 21-1 ページ: 21-37

    • 関連する報告書
      2020 実績報告書
    • 査読あり
  • [雑誌論文] 第4章 語種2020

    • 著者名/発表者名
      金愛蘭
    • 雑誌名

      コーパスで学ぶ日本語学「日本語の語彙・表記」

      巻: - ページ: 63-82

    • 関連する報告書
      2020 実績報告書
  • [雑誌論文] 新語や慣用表現から見た変化、「外来語の氾濫・乱用と叙述語化」2020

    • 著者名/発表者名
      金愛蘭
    • 雑誌名

      日本語の乱れか変化か―逸脱表現や新語の発生と許容―

      巻: - ページ: 153-172

    • 関連する報告書
      2020 実績報告書
  • [雑誌論文] 近代における字音接頭辞「非・不・未・無」2020

    • 著者名/発表者名
      小椋秀樹
    • 雑誌名

      立命館白川靜記念東洋文字文化研究紀要

      巻: 13 ページ: 85-98

    • NAID

      120006881065

    • 関連する報告書
      2019 実績報告書
    • 査読あり
  • [雑誌論文] 新聞における外来語「ルール」の叙述基本語化2019

    • 著者名/発表者名
      金愛蘭
    • 雑誌名

      国語語彙史研究会編『国語語彙史の研究』

      巻: 38 ページ: 362-378

    • 関連する報告書
      2019 実績報告書
  • [学会発表] 『日本語歴史コーパス』ver.2023.3通時コーパス拡張進捗報告2023

    • 著者名/発表者名
      小木曽智信
    • 学会等名
      「通時コーパス」シンポジウム2023
    • 関連する報告書
      2022 実績報告書
  • [学会発表] トピックモデルを用いた単語の通時的な意味変化のモデル化とその応用2023

    • 著者名/発表者名
      井上誠一
    • 学会等名
      「通時コーパス」シンポジウム2023
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 『昭和・平成書き言葉コーパス』と権利処理2023

    • 著者名/発表者名
      小木曽智信
    • 学会等名
      「通時コーパス」シンポジウム2023
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 日本語史における和語2022

    • 著者名/発表者名
      田中牧郞
    • 学会等名
      第62回 語彙・辞書研究会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 日本語語彙の近代化における外来要素の受容と調整2022

    • 著者名/発表者名
      田中牧郞
    • 学会等名
      日本歴史言語学会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] Infinite SCAN: An Infinite Model of Diachronic Semantic Change2022

    • 著者名/発表者名
      Seiichi Inoue, Mamoru Komachi, Toshinobu Ogiso, Hiroya Takamura and Daichi Mochihashi
    • 学会等名
      The 2022 Conference on Empirical Methods in Natural Language Processing (EMNLP 2022)
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] 開かれた言語資源の共同構築と活用に向けて―新しい「通時コーパス」プロジェクトと「語彙資源」プロジェクト―2022

    • 著者名/発表者名
      小木曽智信
    • 学会等名
      NINJALシンポジウム「言語資源学の創成 : 開かれた言語資源による日本語研究」
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 明治期から平成期における接頭辞「非-」の変遷 ―『日本語歴史コーパス』『昭和・平成書き言葉コーパス』を資料として―2022

    • 著者名/発表者名
      小椋秀樹
    • 学会等名
      「通時コーパス」シンポジウム2022 (オンライン)
    • 関連する報告書
      2021 実績報告書
  • [学会発表] 近現代における形容詞ムズカシイの意味と表記2022

    • 著者名/発表者名
      髙橋雄太
    • 学会等名
      「通時コーパス」シンポジウム2022 (オンライン)
    • 関連する報告書
      2021 実績報告書
  • [学会発表] "近現代雑誌通時コーパスの語彙統計情報の公開 "2022

    • 著者名/発表者名
      近藤 明日子,相田 太一,小木曽 智信
    • 学会等名
      言語処理学会第28回年次大会(NLP2022)
    • 関連する報告書
      2021 実績報告書
  • [学会発表] ガウス確率場による単語の意味変化と語義数の同時推定2022

    • 著者名/発表者名
      井上誠一,小町守,小木曽智信,高村大也,持橋大地
    • 学会等名
      言語処理学会第28回年次大会(NLP2022)
    • 関連する報告書
      2021 実績報告書
  • [学会発表] 単語ベクトルの結合学習を用いた近現代語の意味変化の分析2021

    • 著者名/発表者名
      相田 太一,小町 守,小木曽 智信,高村 大也,持橋 大地
    • 学会等名
      じんもんこん2021
    • 関連する報告書
      2021 実績報告書
  • [学会発表] A Comprehensive Analysis of PMI-based Models for Measuring Semantic Differences2021

    • 著者名/発表者名
      Taichi Aida, Mamoru Komachi, Toshinobu Ogiso, Hiroya Takamura, Daichi Mochihashi
    • 学会等名
      PACLIC 35 (2021): The 35th Pacific Asia Conference on Language, Information and Computation
    • 関連する報告書
      2021 実績報告書
  • [学会発表] 利用者からみる通時コーパス資料 ―離縁・離婚の他動詞用法を例に2021

    • 著者名/発表者名
      永澤 済
    • 学会等名
      「通時コーパス」シンポジウム2021
    • 関連する報告書
      2020 実績報告書
  • [学会発表] 近現代日本語の意味変化分析のための単語データセット構築の試み2021

    • 著者名/発表者名
      間淵洋子, 小木曽智信
    • 学会等名
      言語処理学会第27回年次大会
    • 関連する報告書
      2020 実績報告書
  • [学会発表] 通時的な単語の意味変化を捉える単語分散表現の同時学習2021

    • 著者名/発表者名
      相田太一, 小町守, 小木曽智信, 高村大也, 持橋大地
    • 学会等名
      言語処理学会第27回年次大会
    • 関連する報告書
      2020 実績報告書
  • [学会発表] 昭和・平成書き言葉コーパスにみる「ために (為) 」行為者受身文の残存2020

    • 著者名/発表者名
      永澤 済
    • 学会等名
      研究発表会 「昭和・平成書き言葉コーパスによる近現代日本語の実証的研究」
    • 関連する報告書
      2020 実績報告書
  • [学会発表] 近現代日本語通史のための新聞コーパスの設計と構築2020

    • 著者名/発表者名
      間淵 洋子
    • 学会等名
      研究発表会 「昭和・平成書き言葉コーパスによる近現代日本語の実証的研究」
    • 関連する報告書
      2020 実績報告書
  • [学会発表] 単語分散表現を用いた近現代日本語の意味変化の抽出2020

    • 著者名/発表者名
      相田太一,小町 守,小木曽智信,持橋大地
    • 学会等名
      研究発表会 「昭和・平成書き言葉コーパスによる近現代日本語の実証的研究」
    • 関連する報告書
      2020 実績報告書
  • [学会発表] 「昭和・平成書き言葉コーパス」の設計2020

    • 著者名/発表者名
      近藤明日子, 小木曽智信, 髙橋雄太, 田中牧郎, 間淵洋子
    • 学会等名
      日本語学会2020年度秋季大会
    • 関連する報告書
      2020 実績報告書
  • [学会発表] 「昭和・平成書き言葉コーパス」の構築と活用に向けて2020

    • 著者名/発表者名
      小木曽智信
    • 学会等名
      研究発表会 「昭和・平成書き言葉コーパスによる近現代日本語の実証的研究」
    • 関連する報告書
      2020 実績報告書
  • [学会発表] 近代における字音否定接頭辞 「非・不・未・無」の使用実態2020

    • 著者名/発表者名
      小椋秀樹
    • 学会等名
      研究発表会 「昭和・平成書き言葉コーパスによる近現代日本語の実証的研究」
    • 関連する報告書
      2020 実績報告書
  • [学会発表] 近現代における副詞の仮名表記化2020

    • 著者名/発表者名
      髙橋雄太
    • 学会等名
      研究発表会 「昭和・平成書き言葉コーパスによる近現代日本語の実証的研究」
    • 関連する報告書
      2020 実績報告書
  • [学会発表] 単語分散表現の結合学習による単語の意味の通時的変化の分析2020

    • 著者名/発表者名
      相田太一, 小町守, 小木曽智信, 高村大也, 坂田綾香, 小山慎介, 持橋大地
    • 学会等名
      言語処理学会 第26回年次大会
    • 関連する報告書
      2019 実績報告書
  • [備考] 『昭和・平成書き言葉コーパス』

    • URL

      https://clrd.ninjal.ac.jp/shc/

    • 関連する報告書
      2022 実績報告書
  • [備考] コーパス検索アプリケーション「中納言」昭和・平成書き言葉コーパス

    • URL

      https://chunagon.ninjal.ac.jp/shc

    • 関連する報告書
      2022 実績報告書
  • [備考] 近現代口語小説UniDic

    • URL

      https://clrd.ninjal.ac.jp/unidic/back_number.html#unidic_novel

    • 関連する報告書
      2021 実績報告書

URL: 

公開日: 2019-04-18   更新日: 2024-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi