研究課題/領域番号 |
19H00531
|
研究種目 |
基盤研究(A)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
中区分2:文学、言語学およびその関連分野
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
小木曽 智信 大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 教授 (20337489)
|
研究分担者 |
小椋 秀樹 立命館大学, 文学部, 教授 (00321547)
間淵 洋子 和洋女子大学, 人文学部, 准教授 (10415614)
高橋 雄太 明治大学, 国際日本学部, 助教 (20840193)
近藤 明日子 東京大学, 大学院人文社会系研究科(文学部), 助教 (30425722)
松田 謙次郎 神戸松蔭女子学院大学, 文学部, 教授 (40263636)
永澤 済 上智大学, 言語教育研究センター, 准教授 (50613882)
持橋 大地 統計数理研究所, 数理・推論研究系, 准教授 (80418508)
田中 牧郎 明治大学, 国際日本学部, 専任教授 (90217076)
金 愛蘭 日本大学, 文理学部, 准教授 (90466227)
小町 守 東京都立大学, システムデザイン研究科, 教授 (60581329)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
44,850千円 (直接経費: 34,500千円、間接経費: 10,350千円)
2022年度: 9,490千円 (直接経費: 7,300千円、間接経費: 2,190千円)
2021年度: 11,960千円 (直接経費: 9,200千円、間接経費: 2,760千円)
2020年度: 11,960千円 (直接経費: 9,200千円、間接経費: 2,760千円)
2019年度: 11,440千円 (直接経費: 8,800千円、間接経費: 2,640千円)
|
キーワード | コーパス / 日本語史 / 言語変化 / 形態論情報 / 近現代語 / 言語資源 / 自然言語処理 / 日本語学 / 表記 / 語彙 / 語法 |
研究開始時の研究の概要 |
日本語の実証的研究にとってコーパスは欠かせないものとなっているが、既存のコーパスでは昭和期以降の書き言葉のコーパスが不足しているため、明治から現代までの日本語の変化を通時的に研究することが困難である。そこで本研究では「昭和・平成書き言葉コーパス」を構築して、明治以降約150年の日本語の長期的な変化の研究を可能にする。そして、このコーパスを活用して、語彙・文法・表記・国語政策等の各分野においてコーパスにもとづいた実証的な研究を行う。また、新しい統計的な手法による言語変化のモデル化に取り組む。完成したコーパスは改正著作権法に従いインターネット上の検索サービスとして一般公開する。
|
研究成果の概要 |
昭和・平成期の雑誌・ベストセラー書籍・新聞を収録した『昭和・平成書き言葉コーパス』を構築し、国立国語研究所のコーパス検索アプリケーション「中納言」を通してオンラインで公開した。このコーパスは1933年から2013年までの間を8年おきに11か年分,合計約3,340万語収録した大規模なものである。明治・大正期までの『日本語歴史コーパス』の後を承けて、現代に至るまでの日本語の成り立ちを探ることのできる資料として、日本語研究に重要な役割を果たすことが期待される。本研究課題では、このコーパスを活用した日本語史研究も実施し、研究発表会・論文を通して成果を発表した。
|
研究成果の学術的意義や社会的意義 |
本研究課題で構築・公開された『昭和・平成書き言葉コーパス』は、従来欠けていた昭和・平成期の大規模な日本語研究用資料として、今後の日本語研究において重要な役割を果たすことが期待される。本コーパスを『日本語歴史コーパス』に接続することで、上代から現代までの日本語を通時的に、実証的に研究する環境が初めて整った。また、本コーパスから得られる語彙統計情報は、国語辞典編纂・自然言語処理などの分野でも活用されることが期待される。
|