• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

文体分析を目的としたコーパスの文書情報拡張及びその利用

Research Project

Project/Area Number 18K00634
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 02070:Japanese linguistics-related
Research InstitutionMejiro University (2020-2023)
National Institute for Japanese Language and Linguistics (2018-2019)

Principal Investigator

加藤 祥  目白大学, 外国語学部, 専任講師 (40623004)

Co-Investigator(Kenkyū-buntansha) 浅原 正幸  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源開発センター, 教授 (80379528)
Project Period (FY) 2018-04-01 – 2025-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2022: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2021: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2020: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2019: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2018: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Keywordsコーパス / 文体 / 図書館分類
Outline of Annual Research Achievements

本研究課題は、『現代日本語書き言葉均衡コーパス』に含まれる書籍サンプル、新聞サンプル、書籍のうち特に小説サンプルについて、文体分析に資する情報付与を行い、情報を利用した分析の実践を目的としている。書籍サンプルのNDC付与を終えた(既に国立国語研究所の「中納言」で検索可能となっている)後、発表の遅れが生じていたものの、追って、新聞サンプルと小説サンプルの情報付与作業も完了することができた。
そこで、2023年度は、作業の遅れにより残っていた『現代日本語書き言葉均衡コーパス』の小説サンプル(約20,000サンプル)の分類情報付与作業結果をまとめ、「『現代日本語書き言葉均衡コーパス』の小説サンプルに対する分類情報付与」として『国立国語研究所論集』25巻に投稿し、採録された。作成した作業結果データの公開準備を進めている。
また、新聞記事サンプル(約1,500サンプル)への情報付与作業結果についても、「『現代日本語書き言葉均衡コーパス』新聞サブコーパスの記事情報」として『日本語の研究』19(2)に投稿し、採録された。付与情報データの公開準備を進めている。
付与情報データの整備と公開手続きを完了することで、広く本研究課題の作成データの利活用が進むものと期待される。実際の作成データを用いた文体分析はデータ説明のための代表例に留まっているため、次年度中は公開に向けた作業とあわせて、作成データを用いた文体分析の実践を進める。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

2023年度は、これまでの作業結果をまとめ論文として公開できたものの、成果のデータを公開する整備作業と手続きが完了しなかった。そのため、本研究の後半の目的であるデータを活用した分析とその発表に至らなかった。

Strategy for Future Research Activity

2024年度は、作成したデータを成果物として広く利活用可能な形で公開するための整備と公開手続きを完了させる。また、作成したデータを用いた調査分析を実践する。

Report

(6 results)
  • 2023 Research-status Report
  • 2022 Research-status Report
  • 2021 Research-status Report
  • 2020 Research-status Report
  • 2019 Research-status Report
  • 2018 Research-status Report
  • Research Products

    (16 results)

All 2024 2023 2022 2021 2020 2019 2018

All Journal Article (5 results) (of which Peer Reviewed: 3 results,  Open Access: 5 results) Presentation (10 results) Book (1 results)

  • [Journal Article] Newspaper Article Information in the Balanced Corpus of Contemporary Written Japanese: Design and Basic Statistics2023

    • Author(s)
      加藤 祥、浅原 正幸
    • Journal Title

      Studies in the Japanese Language

      Volume: 19 Issue: 2 Pages: 206-214

    • DOI

      10.20666/nihongonokenkyu.19.2_206

    • ISSN
      1349-5119, 2189-5732
    • Year and Date
      2023-08-01
    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Genre Attribute-related Annotations on Fiction Samples in the Balanced Corpus of Contemporary Written Japanese2023

    • Author(s)
      加藤 祥、浅原 正幸
    • Journal Title

      国立国語研究所論集

      Volume: 25 Pages: 59-74

    • DOI

      10.15084/0002000013

    • ISSN
      2186-1358
    • URL

      https://repository.ninjal.ac.jp/records/2000013

    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Enlargement of Nippon Decimal Classification Metadata of Book Samples in the “Balanced Corpus of Contemporary Written Japanese” : Extraction of Essays from Book Samples According to NDC Metadata and Writing Style Analysis2021

    • Author(s)
      加藤 祥、森山 奈々美、浅原 正幸
    • Journal Title

      国立国語研究所論集 = NINJAL Research Papers

      Volume: 21 Issue: 21 Pages: 65-84

    • DOI

      10.15084/00003437

    • NAID

      120007116732

    • ISSN
      2186-1358
    • URL

      https://repository.ninjal.ac.jp/records/3454

    • Related Report
      2021 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] The Lexical Distribution by the Topic annotation data on the Newspaper Articles in the Balanced Corpus of Contemporary Written Japanese2021

    • Author(s)
      加藤 祥、森山 奈々美、浅原 正幸
    • Journal Title

      言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop

      Volume: 6 Pages: 160-170

    • DOI

      10.15084/00003489

    • NAID

      120007181957

    • URL

      http://id.nii.ac.jp/1328/00003489/

    • Related Report
      2021 Research-status Report
    • Open Access
  • [Journal Article] Lexical distribution of the Balanced Corpus of Contemporary Written Japanese by NDC2021

    • Author(s)
      加藤 祥、浅原 正幸
    • Journal Title

      言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop

      Volume: 6 Pages: 218-225

    • DOI

      10.15084/00003496

    • NAID

      120007181950

    • URL

      http://id.nii.ac.jp/1328/00003496/

    • Related Report
      2021 Research-status Report
    • Open Access
  • [Presentation] 『日本経済新聞記事オープンコーパス』に対するメタデータと語義情報付与2024

    • Author(s)
      加藤 祥, 浅原 正幸
    • Organizer
      言語処理学会第30回年次大会
    • Related Report
      2023 Research-status Report
  • [Presentation] 言語的特徴およびトピックの変化から見た初年次アカデミックライティング受講者の学修効果2024

    • Author(s)
      加藤 祥, 服部 紀子, 春日 美穂, 山中 智省, 鈴木 美穂, 鈴木 秀明
    • Organizer
      第48回社会言語科学会研究大会
    • Related Report
      2023 Research-status Report
  • [Presentation] 『現代日本語書き言葉均衡コーパス』における新聞記事種類の分布と典型的新聞記事の特徴2022

    • Author(s)
      加藤 祥、浅原 正幸
    • Organizer
      日本語学会2022年度春季大会
    • Related Report
      2022 Research-status Report
  • [Presentation] 『現代日本語書き言葉均衡コーパス』書籍サブコーパスの小説サンプルに対するジャンル情報付与2022

    • Author(s)
      加藤 祥、浅原 正幸
    • Organizer
      言語資源ワークショップ2022
    • Related Report
      2022 Research-status Report
  • [Presentation] 『現代日本語書き言葉均衡コーパス』新聞記事情報を用いたジャンル別語彙分布2021

    • Author(s)
      加藤 祥、森山 奈々美、浅原 正幸
    • Organizer
      言語資源活用ワークショップ2021
    • Related Report
      2021 Research-status Report
  • [Presentation] 『現代日本語書き言葉均衡コーパス』出版書籍サンプルのNDC別語彙分布2021

    • Author(s)
      加藤 祥、浅原 正幸
    • Organizer
      言語資源活用ワークショップ2021
    • Related Report
      2021 Research-status Report
  • [Presentation] 『現代日本語書き言葉均衡コーパス』新聞サブコーパスに対する新聞記事情報の付与2020

    • Author(s)
      加藤祥,森山奈々美,浅原正幸
    • Organizer
      日本語学会2020年度秋季大会
    • Related Report
      2020 Research-status Report
  • [Presentation] 『現代日本語書き言葉均衡コーパス』書籍サンプルのNDC情報増補2019

    • Author(s)
      加藤祥,森山奈々美,浅原正幸
    • Organizer
      言語資源活用ワークショップ2019
    • Related Report
      2019 Research-status Report
  • [Presentation] Exploring metaphorical expressions in Japanese newspaper-article corpora2019

    • Author(s)
      Sachi Kato, Masayuki Asahara
    • Organizer
      The 15th International Cognitive Linguistics Conference
    • Related Report
      2019 Research-status Report
  • [Presentation] 『現代日本語書き言葉均衡コーパス』書籍サンプルに対するNDC記号拡張アノテーションとNDC形式区分を用いた「随筆」の文体分析2018

    • Author(s)
      加藤祥,櫻井芽衣子,森山奈々美,浅原正幸
    • Organizer
      言語資源活用ワークショップ2018
    • Related Report
      2018 Research-status Report
  • [Book] 認知言語学の羽ばたき2020

    • Author(s)
      松本曜, Dan I. Slobin, 吉成祐子・アンナ = ボルジロフスカヤ・江口清子・眞野美穂, 高橋清子, 森下裕三, Kimi Akita, 陳奕廷, Hirotaka Nakajima, Kohei Suzuki, 篠原和子・松中義大, 加藤祥, 有薗智美, 夏海燕
    • Total Pages
      212
    • Publisher
      開拓社
    • ISBN
      9784758922845
    • Related Report
      2019 Research-status Report

URL: 

Published: 2018-04-23   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi