• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実施状況報告書

文体分析を目的としたコーパスの文書情報拡張及びその利用

研究課題

研究課題/領域番号 18K00634
研究機関目白大学

研究代表者

加藤 祥  目白大学, 外国語学部, 専任講師 (40623004)

研究分担者 浅原 正幸  大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, 教授 (80379528)
研究期間 (年度) 2018-04-01 – 2023-03-31
キーワードコーパス / 文体
研究実績の概要

2020年度は、主に『現代日本語書き言葉均衡コーパス』の新聞サブコーパスを対象とし、新聞記事情報の整備を進めた。ほぼ作業が完了したため、日本語学会秋季大会において、研究代表者・分担者と作業担当者により「『現代日本語書き言葉均衡コーパス』新聞サブコーパスに対する新聞記事情報の付与」というタイトルで学会発表を行った。確認作業が完了すれば、『現代日本語書き言葉均衡コーパス』の新聞サブコーパスに含まれる新聞記事全てに対し、記事の紙面情報等の基本情報をはじめ、記事内容や記事の種別の詳細などが確認できるようになる。本データを用いて、記事内容(政治記事、経済記事、スポーツ記事など)別の分析や、詳細内容(プロ野球、サッカー、ボクシング、相撲など)別の分析、記事種類(報道記事、解説、インタビュー、催し案内など)別の分析などが可能となる。今後、確認作業を進め、2021年度以降のデータ公開を目指している。
また、確認を進めていた同コーパスの図書館・出版書籍サブコーパスを対象とした日本十進分類法の増補が完了した。よって、2020年度より、国立国語研究所の提供している検索ツール「中納言」での検索が可能となった。本作業が完成したことで、様々なジャンルに含まれる随筆を抽出することや、時代別、詳細ジャンル別の分析が可能となっている。本成果については、論文として『国立国語研究所論集』に投稿しており、2021年度中に刊行予定である。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

研究代表者の所属異動や作業担当者の状況変化等により、環境や体制を整えるまでは予定通りに進めることが困難であった。2020年度後半からは体制の再整備を進めているため、成果物の整理や作業結果の確認を適宜行っている。

今後の研究の推進方策

2021年度は、現在確認を進めている『現代日本語書き言葉均衡コーパス』の新聞サブコーパスへの新聞記事情報付与作業を完了させ、成果を論文として投稿、発表することを予定している。
また、同コーパスの図書館・出版サブコーパスに含まれる小説サンプルについて、情報収集と情報付与作業を進める。

次年度使用額が生じた理由

研究代表者の所属異動や作業者の状況変化等に伴い、環境や体制の整備が必要となったため、作業進捗に遅れが生じた。また、新型コロナウイルス感染拡大に伴い、学会や打合せが中止やオンライン開催となったため、旅費が一切使用できなかった。
現環境下での体制を整えることにより、情報付与作業を進め(謝金)、情報付与作業結果の検証実験を行う(その他)予定である。また、データ保存や整理のための物品、状況変化による旅費の使用を予定している。

  • 研究成果

    (1件)

すべて 2020

すべて 学会発表 (1件)

  • [学会発表] 『現代日本語書き言葉均衡コーパス』新聞サブコーパスに対する新聞記事情報の付与2020

    • 著者名/発表者名
      加藤祥,森山奈々美,浅原正幸
    • 学会等名
      日本語学会2020年度秋季大会

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi