研究課題/領域番号 |
24520522
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
小木曽 智信 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (20337489)
|
研究分担者 |
村上 謙 埼玉大学, 教育学部, 准教授 (20431728)
岡部 嘉幸 千葉大学, 人文社会科学研究科(系), 准教授 (80292738)
市村 太郎 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト非常勤研究員 (10701352)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | 近世語 / 形態素解析 / コーパス / 日本語史 / 狂言台本 / 江戸語 / 上方語 |
研究実績の概要 |
本年度は、研究計画の最終年度として研究成果のとりまとめを中心に行った。 形態素解析辞書の開発は、昨年度までの成果を受け、狂言用の形態素解析辞書と、洒落本等の近世口語資料汎用の形態素解析辞書の2つの作成した。前者の狂言用の辞書は、単語分割で98.9%、品詞認定で97%、語彙素認定で96%という高い精度を達成し、国立国語研究所『日本語歴史コーパス』「室町時代編Ⅰ 狂言」の構築に活用された。後者の汎用辞書は、品詞認定でおおむね90%程度にとどまるが、地の文と会話文を分けて解析を行うプログラムを開発することにより、より高い精度で解析することが可能になった。この辞書により洒落本のデータ計15作品について形態素解析を施し、人手修正作業を行った。 研究論文としては、近世語の形態素解析とコーパス開発を扱ったもの2編、形態素解析によるアノテーションを含む近世語のコーパスを活用した研究を4編、合計6編を刊行した。 また、学会発表としては、国際学会での発表2件、国内での研究発表を4件行った。さらに2015年度に発表が確定しているものとして、国内大会2件、国際学会1件がある。 本研究で開発した形態素解析辞書を用いることで、中世から近世の口語資料について形態素解析を行うことが可能になった。これにより、室町時代語や江戸時代(上方・江戸)語の資料に形態素解析を施して『日本語歴史コーパス』を拡張する基盤が整った。
|