2021 Fiscal Year Research-status Report
Project/Area Number |
19K13211
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
片山 久留美 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, プロジェクト非常勤研究員 (10803778)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | コーパス / 表記 / 近世語 / ルビ / 日本語史 |
Outline of Annual Research Achievements |
本研究は、江戸時代後期に流行した読本について、特に本行の漢字表記とそれに対応するルビとの関係に着目して漢字かな交じりテキストとしての読本の表記の特質を捉えようとするものである。刊行年や作者の異なる複数の読本作品をテキストデータ化し、語ごとに品詞や語種などの形態論情報を付与したコーパスを作成している。このコーパスデータを使用し、品詞や語種の観点から読本の表記の特徴を調査している。2021年度は研究計画に基づき以下の各項目について作業を進めた。 ①コーパス化の対象となる資料についてテキストデータ化を行った。 ②テキストデータをもとに形態素解析・人手による修正を試行し、データ構築の問題点を検討した。 ③上記の作業中に明らかになった課題をまとめ、研究会においてポスター発表を行った。 ポスター発表ではコーパス化する作品の選定や、特殊なルビへの形態論情報付与の手法などについて指摘を受けた。指摘された内容を踏まえ、XML・形態素解析の方法などを再検討してこれまで作成したデータの修正を行った。特にルビに付与する形態論情報は、ルビの表す語と本行の語との対応関係を明らかにしようとする本研究にとって重要な意義を持つため、より適切なコーパスデータ化ができるよう慎重に検討を重ねている。国立国語研究所が公開する『日本語歴史コーパス』江戸時代編のデータも参考にしながら、引き続きコーパスデータの質・量の向上を試みる予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
コーパスデータ構築にあたり、特殊なルビの処理などの仕様検討に想定以上に時間を要したため、やや作業進行が遅れている。問題点を明確にし、仕様を再検討したことで次年度以降作業ペースを上げられるよう工夫した。
|
Strategy for Future Research Activity |
構築がやや遅れているコーパスデータについて、まずは複数作品の対照研究が可能になるよう一作品のデータ量を調整し構築を進める。完成したデータを使用し、漢字・仮名の使用状況などを調査し研究発表・論文の執筆を行う。合わせて、データの拡張・コーパス公開方法の検討を行う予定である。
|
Causes of Carryover |
学会のオンライン開催が続いたため旅費の使用額が予定を下回った。また、コーパスデータの修正作業にあたり作業協力者に作業を依頼する予定であったが、申請者が試行を繰り返しながら自ら作業を行ったため人件費の支出が当初予定より減少した。次年度以降データの拡張に伴い、作業協力者に積極的に作業を依頼する予定である。
|