• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実績報告書

昭和・平成書き言葉コーパスによる近現代日本語の実証的研究

研究課題

研究課題/領域番号 19H00531
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

小木曽 智信  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 教授 (20337489)

研究分担者 小椋 秀樹  立命館大学, 文学部, 教授 (00321547)
間淵 洋子  和洋女子大学, 人文学部, 准教授 (10415614)
高橋 雄太  明治大学, 国際日本学部, 助教 (20840193)
近藤 明日子  大学共同利用機関法人人間文化研究機構国立国語研究所, 大学共同利用機関等の部局等, 研究員 (30425722)
松田 謙次郎  神戸松蔭女子学院大学, 文学部, 教授 (40263636)
永澤 済  名古屋大学, 国際機構, 准教授 (50613882)
持橋 大地  統計数理研究所, 数理・推論研究系, 准教授 (80418508)
田中 牧郎  明治大学, 国際日本学部, 専任教授 (90217076)
金 愛蘭  日本大学, 文理学部, 准教授 (90466227)
研究期間 (年度) 2019-04-01 – 2023-03-31
キーワードコーパス / 日本語史 / 言語変化 / 形態論情報 / 近現代語 / 言語資源 / 自然言語処理
研究実績の概要

国立国語研究所を中心とするコーパス構築班と、研究分担者の全員が参加するコーパス応用班とで研究活動を行った。
コーパス構築班では、構築を進めて予定しているコーパス(1933年から2013年までの8年おき11年分の雑誌・新聞・ベストセラー書籍)のデータ作成のうち、雑誌と大部分のベストセラー書籍・新聞についてテキスト入力・XMLによる文書構造アノテーションを終え、形態素解析を行ってデータの整備・未知語の辞書登録作業を実施した。
コーパス応用班では、国語研「通時コーパス」プロジェクトとの共催によるシンポジウムを含めて3回の研究会を開催し、近現代日本語の表記・語彙・文法変化に関する研究発表を行った。
言語変化の統計モデリングについては、国立国語研究所新領域創出型プロジェクト「現代語の意味の変化に対する計算的・統計力学的アプローチ」と共同で研究を行ない3月に「現代語の意味の変化に対する 計算的・統計力学的アプローチ」 シンポジウムを開催したほか、言語処理学会において2件の研究発表を行った。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

公開用サーバーの購入など環境の整備に時間を要したため、雑誌の先行公開は見送ったものの、コーパス整備全体では概ね予定通りに進捗している。
共催も含めて3回の研究発表会を行い、研究成果についても十分に発表することができた。

今後の研究の推進方策

コーパス構築班においては、現在の計画を継続し、雑誌・ベストセラー書籍・新聞のコーパス構築について、特に形態論情報の整備を中心に継続する。また、コーパス公開環境の準備をすすめ、年度末に『昭和・平成書き言葉コーパス』としての公開に備える。
コーパス応用班では、研究発表会を年2回程度開催するほか、国立国語研究所の「通時コーパス」プロジェクト等の関連研究との共同研究も実施し、論文・学会発表による研究成果の発信に努める。

  • 研究成果

    (10件)

すべて 2022 2021 その他

すべて 雑誌論文 (3件) (うち査読あり 3件、 オープンアクセス 1件) 学会発表 (6件) 備考 (1件)

  • [雑誌論文] 近現代における副詞の仮名表記化2022

    • 著者名/発表者名
      髙橋雄太
    • 雑誌名

      論究日本近代語

      巻: 第二集 ページ: 221-234

    • 査読あり
  • [雑誌論文] 新漢字と旧漢字が混在したテキストからの短単位形態素の抽出について2021

    • 著者名/発表者名
      松田謙次郎
    • 雑誌名

      国立国語研究所論集

      巻: 21 ページ: 123-132

    • DOI

      10.15084/00003440

    • 査読あり / オープンアクセス
  • [雑誌論文] 明治・大正期における否定の字音接頭辞 ―「非」を中心に―2021

    • 著者名/発表者名
      小椋秀樹
    • 雑誌名

      国語語彙史の研究

      巻: 40 ページ: 208-189

    • 査読あり
  • [学会発表] 明治期から平成期における接頭辞「非-」の変遷 ―『日本語歴史コーパス』『昭和・平成書き言葉コーパス』を資料として―2022

    • 著者名/発表者名
      小椋秀樹
    • 学会等名
      「通時コーパス」シンポジウム2022 (オンライン)
  • [学会発表] 近現代における形容詞ムズカシイの意味と表記2022

    • 著者名/発表者名
      髙橋雄太
    • 学会等名
      「通時コーパス」シンポジウム2022 (オンライン)
  • [学会発表] "近現代雑誌通時コーパスの語彙統計情報の公開 "2022

    • 著者名/発表者名
      近藤 明日子,相田 太一,小木曽 智信
    • 学会等名
      言語処理学会第28回年次大会(NLP2022)
  • [学会発表] ガウス確率場による単語の意味変化と語義数の同時推定2022

    • 著者名/発表者名
      井上誠一,小町守,小木曽智信,高村大也,持橋大地
    • 学会等名
      言語処理学会第28回年次大会(NLP2022)
  • [学会発表] 単語ベクトルの結合学習を用いた近現代語の意味変化の分析2021

    • 著者名/発表者名
      相田 太一,小町 守,小木曽 智信,高村 大也,持橋 大地
    • 学会等名
      じんもんこん2021
  • [学会発表] A Comprehensive Analysis of PMI-based Models for Measuring Semantic Differences2021

    • 著者名/発表者名
      Taichi Aida, Mamoru Komachi, Toshinobu Ogiso, Hiroya Takamura, Daichi Mochihashi
    • 学会等名
      PACLIC 35 (2021): The 35th Pacific Asia Conference on Language, Information and Computation
  • [備考] 近現代口語小説UniDic

    • URL

      https://clrd.ninjal.ac.jp/unidic/back_number.html#unidic_novel

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi