2020 Fiscal Year Research-status Report
Project/Area Number |
19K13211
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
片山 久留美 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, プロジェクト非常勤研究員 (10803778)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | コーパス / 表記 / 近世語 / ルビ / 日本語史 |
Outline of Annual Research Achievements |
本研究は、江戸時代後期に流行した読本について、特に本行の漢字表記とそれに対応するルビとの関係に着目して漢字かな交じりテキストとしての読本の表記の特質を捉えようとするものである。刊行年や作者の異なる複数の作品に対して、語ごとに品詞や語種などの形態論情報を付与したコーパスを作成している。全文を対象にコーパス化を行うことで、漢字表記箇所だけでなく仮名表記箇所も含めた研究、たとえばテキスト全体における漢字使用率や同一語に対する漢字表記・仮名表記の使用傾向の検討などを行うことができる。2020年度は、研究計画に基づき以下の各項目について作業を進めた。 ①コーパス化の対象となる資料について、テキスト入力の仕様を検討し一部作品のテキストデータ化を行った。 ②テキストデータをもとに、形態素解析のためのXMLの仕様の検討を前年度に引き続き行い、形態素解析を試行した。 ③コーパス化する作品について、資料の刊行時期や作者などのバランスを考慮して再検討を行った。また、先行研究の収集・検討を行い、コーパスに付与すべき情報を検討した。 ①②にあたっては、特殊なルビの処理などについて国立国語研究所『日本語歴史コーパス江戸時代編』の各コーパスの処理を参考に、入力と修正を進めた。『日本語歴史コーパス』と同等の仕様とすることで、読本だけでなく「江戸時代編」に収録されている洒落本や人情本といった資料との対照研究も視野に入れている。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
テキストデータの入力について、仕様を検討しながら自ら行ったため当初の作業計画から遅れが生じている。ただし効率的な作業の進め方を検討し、次年度以降スムーズに進行するよう努めた。
|
Strategy for Future Research Activity |
テキストデータの入力については仕様が定まったため外部業者への入力を依頼し作業ペースを大幅に改善する見込みである。また、複数作品のコーパス化を優先し、一作品ごとの分量を調整することも検討している。データ整備の進捗等を学会報告し、コーパスデータの改善に努める。
|
Causes of Carryover |
データ入力を研究代表者自身で行ったため、「人件費・謝金」として計上した分の計画に変更が生じた。また、学会の中止やオンラインでの開催により、「旅費」についても当初計画より差額が生じている。
|