近代語コーパスの計量分析に基づく同語異表記の通時的研究
Project/Area Number |
15K02585
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Research Field |
Japanese linguistics
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
間淵 洋子 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト非常勤研究員 (10415614)
|
Project Period (FY) |
2015-04-01 – 2016-03-31
|
Project Status |
Discontinued (Fiscal Year 2015)
|
Budget Amount *help |
¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2017: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2016: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
Fiscal Year 2015: ¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
|
Keywords | 二字漢語 / 表記 / バリエーション / コーパス / 近現代 / 通時的変化 / 国語施策 |
Outline of Annual Research Achievements |
本研究が目的とする二字漢語の表記バリエーションの実態とその変化について明らかにするために,主に以下4点について調査・研究を行った。 1.調査対象語の抽出と分析:国語研究所において既公開及び構築中の近代雑誌コーパス全体(総語数約1,400万語)と,既公開の『現代日本語書き言葉均衡コーパス』の出版サブコーパス(総語数約3,400万語)を用いて大規模な漢語語彙調査を行い,近現代に共通して一定数用いられる漢語のうち,同語異表記関係にある表記形を網羅的に取り出した。近現代における表記の差異や変化過程を明らかにした。 2.分析項目の検討・整理:表記の差異を明確に分析するために,辞書等に基づき漢字字体の関係性(新字・旧字関係,異体字関係,別字関係等)を整理したほか,国語施策の調査に基づき各種漢字表等(1916年漢字字体整理案,1923年常用漢字表,1946年当用漢字表等)への掲載有無を整理した。これを,上記1の結果と関連付け,変化要因についての考察と合わせて計量国語学会において発表を行い,機関誌『計量国語学』に投稿した。 3.既存コーパスのうち整備が不十分であった雑誌『太陽』の一部の記事について,原文のルビ情報を付与する作業を行い,このルビに基づく語の認定(例えば「明日」という漢字文字列が「あす」又は「あした」という和語か「ミョウニチ」という漢語かという認定)を行った。 4.新規コーパスの構築:メディアやジャンルの差による言葉の差異(位相差)を検討するため,既存の雑誌とは異なるメディアの文章として,(a)教科書,(b)新聞,(c)小説を選び,それぞれコーパス化の準備を進めた。(a)は国定読本の形態論情報付きコーパスを構築中,(b)は収録対象(明治大正の読売新聞から5か年各2日分)の選定及びテキスト文字入力が終了,(c)は収録対象の選定が終了した。
|
Report
(1 results)
Research Products
(8 results)