研究課題/領域番号 |
23H00632
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分02070:日本語学関連
小区分02090:日本語教育関連
合同審査対象区分:小区分02070:日本語学関連、小区分02090:日本語教育関連
|
研究機関 | 北海道大学 |
研究代表者 |
伊藤 孝行 北海道大学, メディア・コミュニケーション研究院, 准教授 (00588478)
|
研究分担者 |
山下 倫央 北海道大学, 情報科学研究院, 准教授 (50415759)
横山 想一郎 北海道大学, 情報科学研究院, 助教 (80795732)
川村 秀憲 北海道大学, 情報科学研究院, 教授 (60322830)
小木曽 智信 大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 教授 (20337489)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
18,460千円 (直接経費: 14,200千円、間接経費: 4,260千円)
2023年度: 10,010千円 (直接経費: 7,700千円、間接経費: 2,310千円)
|
キーワード | 帝国議会議事速記録 / 日本語史 / 近代語 / テキストマイニング / コーパス |
研究開始時の研究の概要 |
本研究では『帝国議会議事速記録集』(1890-1947年)を資料とし,国立国会図書館が2022年4月に公開したOCR(光学的文字認識)処理プログラムによる認識結果を援用し,CHJを大幅に補強しBCCWJとつなぐコーパスの作成・一般公開を行う。また,作成したコーパスを使用し,テキストマイニングを用いることでこれまで明らかにされてこなかった明治期から戦中期の言語変化を解明し,現代語の形成過程の解明につながる知見を抽出する。
|