• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実績報告書

昭和・平成書き言葉コーパスによる近現代日本語の実証的研究

研究課題

研究課題/領域番号 19H00531
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

小木曽 智信  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 教授 (20337489)

研究分担者 小椋 秀樹  立命館大学, 文学部, 教授 (00321547)
間淵 洋子  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 特任助教 (10415614)
松田 謙次郎  神戸松蔭女子学院大学, 文学部, 教授 (40263636)
永澤 済  名古屋大学, 国際機構, 准教授 (50613882)
持橋 大地  統計数理研究所, 数理・推論研究系, 准教授 (80418508)
田中 牧郎  明治大学, 国際日本学部, 専任教授 (90217076)
金 愛蘭  日本大学, 文理学部, 准教授 (90466227)
近藤 明日子  大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト非常勤研究員 (30425722)
高橋 雄太  明治大学, 国際日本学部, 助教 (20840193)
研究期間 (年度) 2019-04-01 – 2023-03-31
キーワードコーパス / 近現代語 / 言語変化 / 言語資源 / 日本語学 / 表記 / 語彙 / 語法
研究実績の概要

国立国語研究所を中心とするコーパス構築班(小木曽・間淵・田中・近藤・高橋)と、研究分担者の全員(小木曽・間淵・田中・小椋・金・永澤・松田・持橋・近藤・高橋)が参加するコーパス応用班に分かれて研究活動を行った。
本年度のコーパス構築班では、期間中に構築を予定しているコーパス(1933年から1997年までの8年おき9年分の雑誌・新聞・ベストセラー書籍)のデータ作成のうち、雑誌サブコーパスのXMLによる構造化と、新聞サブコーパスのテキスト入力、ベストセラー書籍の原本の入手とその一部のOCRによるテキスト化を行った。また、雑誌については形態素解析済みデータの整備・未知語の辞書登録作業を行った。日本語学会秋季大会では、本コーパスの構築についての研究発表を行った。
コーパス応用班では、公開の研究発表会を1回主催したほか、国語研「通時コーパス」プロジェクトとの共催によるシンポジウムを2回、非公開の研究会を1回開催し、CHJ・BCCWJと本研究課題で構築した雑誌のデータを用いた近現代日本語の研究発表を行った。このほか、論文3編、研究発表10件と十分な実績をあげることができた。
言語変化の統計モデリングについては、国立国語研究所新領域創出型プロジェクト「現代語の意味の変化に対する計算的・統計力学的アプローチ」と共同で、新たに作成したデータを活用し単語分散表現を用いた言語変化の研究を行ない、言語処理学会において2件の研究発表を行った。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

ほぼ当初の計画どおり順調に進んでいる。雑誌のサブコーパスについては今年度でテキスト作成と構造化をほぼ終え、来年度の公開に備える。新聞については今年度でテキスト作成をほぼ完了しており、ベストセラー書籍についても概ね予定通り進捗している。
共催も含めて3回の公開研究発表会を行い、研究成果についても研究論文3編、研究発表10件と十分な実績をあげることができた。

今後の研究の推進方策

現在の計画を継続し、コーパス構築班においては、雑誌サブコーパスは2021年度末までにオンラインでの公開を目指す。また、新聞サブコーパスはXMLによる構造化を終え、翌年度の公開に向けてデータ整備を行う。ベストセラー書籍についてもテキスト化を進め、最終年度の公開に向けてデータ整備を行う。
コーパス応用班では、研究発表会を年2回程度開催するほか、国立国語研究所の「通時コーパス」プロジェクト等の関連研究との共同研究も実施し、論文・学会発表による研究成果の発信に努める。

  • 研究成果

    (13件)

すべて 2021 2020

すべて 雑誌論文 (3件) (うち査読あり 1件) 学会発表 (10件)

  • [雑誌論文] 「Xノタメニ」受身文の残存と衰退:近現代コーパスからみる2021

    • 著者名/発表者名
      永澤済
    • 雑誌名

      日本語文法

      巻: 21-1 ページ: 21-37

    • 査読あり
  • [雑誌論文] 第4章 語種2020

    • 著者名/発表者名
      金愛蘭
    • 雑誌名

      コーパスで学ぶ日本語学「日本語の語彙・表記」

      巻: - ページ: 63-82

  • [雑誌論文] 新語や慣用表現から見た変化、「外来語の氾濫・乱用と叙述語化」2020

    • 著者名/発表者名
      金愛蘭
    • 雑誌名

      日本語の乱れか変化か―逸脱表現や新語の発生と許容―

      巻: - ページ: 153-172

  • [学会発表] 利用者からみる通時コーパス資料 ―離縁・離婚の他動詞用法を例に2021

    • 著者名/発表者名
      永澤 済
    • 学会等名
      「通時コーパス」シンポジウム2021
  • [学会発表] 近現代日本語の意味変化分析のための単語データセット構築の試み2021

    • 著者名/発表者名
      間淵洋子, 小木曽智信
    • 学会等名
      言語処理学会第27回年次大会
  • [学会発表] 通時的な単語の意味変化を捉える単語分散表現の同時学習2021

    • 著者名/発表者名
      相田太一, 小町守, 小木曽智信, 高村大也, 持橋大地
    • 学会等名
      言語処理学会第27回年次大会
  • [学会発表] 昭和・平成書き言葉コーパスにみる「ために (為) 」行為者受身文の残存2020

    • 著者名/発表者名
      永澤 済
    • 学会等名
      研究発表会 「昭和・平成書き言葉コーパスによる近現代日本語の実証的研究」
  • [学会発表] 近現代日本語通史のための新聞コーパスの設計と構築2020

    • 著者名/発表者名
      間淵 洋子
    • 学会等名
      研究発表会 「昭和・平成書き言葉コーパスによる近現代日本語の実証的研究」
  • [学会発表] 単語分散表現を用いた近現代日本語の意味変化の抽出2020

    • 著者名/発表者名
      相田太一,小町 守,小木曽智信,持橋大地
    • 学会等名
      研究発表会 「昭和・平成書き言葉コーパスによる近現代日本語の実証的研究」
  • [学会発表] 「昭和・平成書き言葉コーパス」の設計2020

    • 著者名/発表者名
      近藤明日子, 小木曽智信, 髙橋雄太, 田中牧郎, 間淵洋子
    • 学会等名
      日本語学会2020年度秋季大会
  • [学会発表] 「昭和・平成書き言葉コーパス」の構築と活用に向けて2020

    • 著者名/発表者名
      小木曽智信
    • 学会等名
      研究発表会 「昭和・平成書き言葉コーパスによる近現代日本語の実証的研究」
  • [学会発表] 近代における字音否定接頭辞 「非・不・未・無」の使用実態2020

    • 著者名/発表者名
      小椋秀樹
    • 学会等名
      研究発表会 「昭和・平成書き言葉コーパスによる近現代日本語の実証的研究」
  • [学会発表] 近現代における副詞の仮名表記化2020

    • 著者名/発表者名
      髙橋雄太
    • 学会等名
      研究発表会 「昭和・平成書き言葉コーパスによる近現代日本語の実証的研究」

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi