Project/Area Number |
19K13211
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 02070:Japanese linguistics-related
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
片山 久留美 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, プロジェクト非常勤研究員 (10803778)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Project Status |
Granted (Fiscal Year 2021)
|
Budget Amount *help |
¥3,640,000 (Direct Cost: ¥2,800,000、Indirect Cost: ¥840,000)
Fiscal Year 2022: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2021: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2020: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2019: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
|
Keywords | コーパス / 表記 / 近世語 / ルビ / 日本語史 / 読本 |
Outline of Research at the Start |
江戸時代後期に流行した小説の一種である読本には、本行の漢字表記「准備」に対してルビ「こころかまへ」や「ようゐ」が対応するなど、ルビと本行の漢字表記の対応に多様なバリエーションがある。本研究では、ルビ(=書かれている語)の側の性質に焦点を当て、語種や品詞によって表記にどのような特徴があるかを計量的に調査し、読本というジャンルの持つ表記特性を明らかにする。作者・刊行時期の異なる複数の作品について、品詞や表記などの形態論情報を付与したコーパスを作成し、広く今後の読本研究・表記研究に資するものとすることを目指す。
|
Outline of Annual Research Achievements |
本研究は、江戸時代後期に流行した読本について、特に本行の漢字表記とそれに対応するルビとの関係に着目して漢字かな交じりテキストとしての読本の表記の特質を捉えようとするものである。刊行年や作者の異なる複数の読本作品をテキストデータ化し、語ごとに品詞や語種などの形態論情報を付与したコーパスを作成している。このコーパスデータを使用し、品詞や語種の観点から読本の表記の特徴を調査している。2021年度は研究計画に基づき以下の各項目について作業を進めた。 ①コーパス化の対象となる資料についてテキストデータ化を行った。 ②テキストデータをもとに形態素解析・人手による修正を試行し、データ構築の問題点を検討した。 ③上記の作業中に明らかになった課題をまとめ、研究会においてポスター発表を行った。 ポスター発表ではコーパス化する作品の選定や、特殊なルビへの形態論情報付与の手法などについて指摘を受けた。指摘された内容を踏まえ、XML・形態素解析の方法などを再検討してこれまで作成したデータの修正を行った。特にルビに付与する形態論情報は、ルビの表す語と本行の語との対応関係を明らかにしようとする本研究にとって重要な意義を持つため、より適切なコーパスデータ化ができるよう慎重に検討を重ねている。国立国語研究所が公開する『日本語歴史コーパス』江戸時代編のデータも参考にしながら、引き続きコーパスデータの質・量の向上を試みる予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
コーパスデータ構築にあたり、特殊なルビの処理などの仕様検討に想定以上に時間を要したため、やや作業進行が遅れている。問題点を明確にし、仕様を再検討したことで次年度以降作業ペースを上げられるよう工夫した。
|
Strategy for Future Research Activity |
構築がやや遅れているコーパスデータについて、まずは複数作品の対照研究が可能になるよう一作品のデータ量を調整し構築を進める。完成したデータを使用し、漢字・仮名の使用状況などを調査し研究発表・論文の執筆を行う。合わせて、データの拡張・コーパス公開方法の検討を行う予定である。
|
Report
(3 results)
Research Products
(1 results)