研究課題/領域番号 |
24520522
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
日本語学
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
小木曽 智信 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (20337489)
|
研究分担者 |
村上 謙 埼玉大学, 教育学部, 准教授 (20431728)
岡部 嘉幸 千葉大学, 人文社会科学研究科, 准教授 (80292738)
市村 太郎 国立国語研究所, コーパス開発センター, プロジェクト非常勤研究員 (10701352)
|
研究協力者 |
鴻野 知暁 国立国語研究所, コーパス開発センター, プロジェクト非常勤研究員 (30751515)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
研究課題ステータス |
完了 (2014年度)
|
配分額 *注記 |
5,070千円 (直接経費: 3,900千円、間接経費: 1,170千円)
2014年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2013年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2012年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
|
キーワード | 近世語 / 形態素解析 / コーパス / 日本語史 / 狂言台本 / 江戸語 / 上方語 |
研究成果の概要 |
今日、日本語の歴史を研究するためのコーパスの構築が望まれている。このコーパス構築のためには、さまざまな歴史的な資料に単語の情報を自動で付与する形態素解析を行う必要があるが、これまでに近世(江戸時代)の資料を対象としたものはなかった。本研究の目的は、主として近世の口語資料を、研究に必要な精度で解析できるようにすることである。既存の辞書を元に見出し語を増やし、専用のコーパスを用いて機械学習を行った結果、狂言台本や洒落本のテキストを高い精度で解析することが可能になった。この辞書は「日本語歴史コーパス」の構築に利用され成果を上げている。
|