2022 Fiscal Year Annual Research Report
昭和・平成書き言葉コーパスによる近現代日本語の実証的研究
Project/Area Number |
19H00531
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
小木曽 智信 大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 教授 (20337489)
|
Co-Investigator(Kenkyū-buntansha) |
小椋 秀樹 立命館大学, 文学部, 教授 (00321547)
間淵 洋子 和洋女子大学, 人文学部, 准教授 (10415614)
高橋 雄太 明治大学, 国際日本学部, 助教 (20840193)
近藤 明日子 東京大学, 大学院人文社会系研究科(文学部), 助教 (30425722)
松田 謙次郎 神戸松蔭女子学院大学, 文学部, 教授 (40263636)
永澤 済 上智大学, 言語教育研究センター, 准教授 (50613882)
持橋 大地 統計数理研究所, 数理・推論研究系, 准教授 (80418508)
田中 牧郎 明治大学, 国際日本学部, 専任教授 (90217076)
金 愛蘭 日本大学, 文理学部, 准教授 (90466227)
小町 守 東京都立大学, システムデザイン研究科, 教授 (60581329)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | コーパス / 日本語史 / 言語変化 / 形態論情報 / 近現代語 / 言語資源 / 自然言語処理 |
Outline of Annual Research Achievements |
コーパス構築班では、予定通りコーパスの整備を終え、『昭和・平成書き言葉コーパス』を構築しオンラインで公開した。このコーパスは日本語の歴史的変化を研究するための基礎資料として昭和・平成期の雑誌・ベストセラー書籍・新聞を収録したもので、1933年から 2013年までの間を8年おきに11か年分,合計約3,340万語を収録した大規模なものである。明治・大正期までの『日本語歴史コーパス』の後をうけ、現代に至るまでの日本語の成り立ちを探ることのできる資料として、日本語研究に重要な役割を果たすことが期待される。全文にUniDicによる短単位情報が付与されており『日本語歴史コーパス』や『現代日本語書き言葉均衡コーパス』と比較対照した研究が可能となった。 公開にあたっては、平成30年に改正された著作権法の柔軟な権利制限規定にもとづき表示される文脈長を制限するなどの条件の下で著作者の許諾を得ることなく、弁護士への確認を経て適法な形に公開している。コーパス検索アプリケーション「中納言」上で、検索サービスとして公開するほか、語彙表頻度表などの統計情報も公開する。 コーパス活用班では、コーパス研究会を3回開き、開発中のコーパスを用いた近現代日本語の表記・語彙・文法に関する研究の成果発表を行って、一部を研究論文として刊行した。
|
Research Progress Status |
令和4年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和4年度が最終年度であるため、記入しない。
|
Research Products
(13 results)