研究課題/領域番号 |
18K00634
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分02070:日本語学関連
|
研究機関 | 目白大学 (2020-2022) 大学共同利用機関法人人間文化研究機構国立国語研究所 (2018-2019) |
研究代表者 |
加藤 祥 目白大学, 外国語学部, 専任講師 (40623004)
|
研究分担者 |
浅原 正幸 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源開発センター, 教授 (80379528)
|
研究期間 (年度) |
2018-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2022年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2021年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2020年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2019年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2018年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | コーパス / 文体 / 図書館分類 |
研究実績の概要 |
2022年度は、特に『現代日本語書き言葉均衡コーパス』の書籍サンプルに含まれるすべての小説サンプルについて、小説の内容に関するジャンルや舞台設定等の分類情報(「推理」、「SF」、「アドベンチャー」「ロマンス」など)を付与した結果の整理を進めた。本作業手順と付与情報を国立国語研究所の開催した「言語資源ワークショップ2022」で「『現代日本語書き言葉均衡コーパス』書籍サブコーパスの小説サンプルに対するジャンル情報付与」として発表した。また、これらの情報付与結果を集計し、各分類の特徴分析を行ったほか、既存の文体指標との対照を行った。分析や調査の結果は、論考として投稿中である。なお、最終年度となる2023年度には、小説サンプルへの情報付与結果の公開を目指しており、公開準備のためのデータ整備を進めているところである。 また、2021年度までに情報付与を勧めた『現代日本語書き言葉均衡コーパス』の新聞サンプルデータを用い、「日本語学会2022年度春季大会」において「『現代日本語書き言葉均衡コーパス』における新聞記事種類の分布と典型的新聞記事の特徴」として、分析結果を発表した。評論や連載、催し案内などの様々な記事種類の分布とともに、典型的な新聞記事を抽出することが可能になったことを示した。これらの新聞サンプルへの情報付与とその結果について、データの整備を行うと同時に成果をまとめるなど、広く公開準備を進めた。学会発表のほか、フォーラムや研究会でも、付与した情報の利活用の実践例を示し、活用可能性を提案した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2022年度までの作業成果公開とその利活用の試行を目指していたが、学会発表および論文投稿などの遅れにより、成果公開に至らず、2022年度中には課題が終了しなかった。
|
今後の研究の推進方策 |
2023年度は最終年度として、これまでに付与した『現代日本語書き言葉均衡コーパス』新聞サブコーパスおよび書籍サブコーパスの小説サンプルに対する情報を公開可能な形に整備し、順次公開する予定である。また、投稿中の原稿の校正を進め、成果として論文を発表することを予定している。
|