Development and application of electronic modern-literary Japanese dictionary for morphological analysis
Project/Area Number |
19720110
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
Japanese linguistics
|
Research Institution | The National Institute for Japanese Language |
Principal Investigator |
OGISO Toshinobu The National Institute for Japanese Language, 研究開発部門, 研究員 (20337489)
|
Project Period (FY) |
2007 – 2008
|
Project Status |
Completed (Fiscal Year 2008)
|
Budget Amount *help |
¥3,230,000 (Direct Cost: ¥2,900,000、Indirect Cost: ¥330,000)
Fiscal Year 2008: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2007: ¥1,800,000 (Direct Cost: ¥1,800,000)
|
Keywords | 近代語 / 形態素解析 / 電子化辞書 / コーパス / 言語学 / 国語学 / 日本語学 / 日本語史 / 自然言語処理 |
Research Abstract |
本研究では近代文語文の形態素解析を行うための電子化辞書「近代文語UniDic」を作成し、日本語研究者に利用しやすい形にまとめ上げてインターネット上で一般公開を行った。この辞書は「現代日本語書き言葉均衡コーパス」の開発に用いられているUniDic をベースにしており、斉一な単位・階層化された見出し語などの設計を受け継いだ、言語研究に適した辞書となっている。また、近代文語UniDic は現代語用のUniDic と見出し語の互換性があるため、近代語と現代語の比較研究に利用することが可能となった。 この形態素解析辞書の応用として、この辞書で『太陽コーパス』を解析した結果を用いて語彙頻度表を作成し、コーパス言語学的手法による近代語語彙の記述的研究を行った。また、これを『現代日本語書き言葉均衡コーパス』(モニター版)を現代語版のUniDic で解析した結果と比較することにより、近代語と現代語の語彙の比較研究を行った。 これらの研究成果については研究成果報告書『近代文語文を対象とした形態素解析のための電子化辞書の作成とその活用』(全233 ページ)にまとめ、公開した。
|
Report
(3 results)
Research Products
(15 results)