研究課題/領域番号 |
18K00634
|
研究機関 | 目白大学 |
研究代表者 |
加藤 祥 目白大学, 外国語学部, 専任講師 (40623004)
|
研究分担者 |
浅原 正幸 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源開発センター, 教授 (80379528)
|
研究期間 (年度) |
2018-04-01 – 2025-03-31
|
キーワード | コーパス / 文体 |
研究実績の概要 |
本研究課題は、『現代日本語書き言葉均衡コーパス』に含まれる書籍サンプル、新聞サンプル、書籍のうち特に小説サンプルについて、文体分析に資する情報付与を行い、情報を利用した分析の実践を目的としている。書籍サンプルのNDC付与を終えた(既に国立国語研究所の「中納言」で検索可能となっている)後、発表の遅れが生じていたものの、追って、新聞サンプルと小説サンプルの情報付与作業も完了することができた。 そこで、2023年度は、作業の遅れにより残っていた『現代日本語書き言葉均衡コーパス』の小説サンプル(約20,000サンプル)の分類情報付与作業結果をまとめ、「『現代日本語書き言葉均衡コーパス』の小説サンプルに対する分類情報付与」として『国立国語研究所論集』25巻に投稿し、採録された。作成した作業結果データの公開準備を進めている。 また、新聞記事サンプル(約1,500サンプル)への情報付与作業結果についても、「『現代日本語書き言葉均衡コーパス』新聞サブコーパスの記事情報」として『日本語の研究』19(2)に投稿し、採録された。付与情報データの公開準備を進めている。 付与情報データの整備と公開手続きを完了することで、広く本研究課題の作成データの利活用が進むものと期待される。実際の作成データを用いた文体分析はデータ説明のための代表例に留まっているため、次年度中は公開に向けた作業とあわせて、作成データを用いた文体分析の実践を進める。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2023年度は、これまでの作業結果をまとめ論文として公開できたものの、成果のデータを公開する整備作業と手続きが完了しなかった。そのため、本研究の後半の目的であるデータを活用した分析とその発表に至らなかった。
|
今後の研究の推進方策 |
2024年度は、作成したデータを成果物として広く利活用可能な形で公開するための整備と公開手続きを完了させる。また、作成したデータを用いた調査分析を実践する。
|
次年度使用額が生じた理由 |
成果物(情報付与したデータ)の公開に向けた整備作業が完了しなかったため、2024年度も整備作業を続ける必要がある。主に作業用物品とアルバイト謝金として利用する。また、データ公開と分析結果発表の旅費使用の予定がある。
|