2022 Fiscal Year Research-status Report
Project/Area Number |
19K13211
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
片山 久留美 大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, プロジェクト非常勤研究員 (10803778)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Keywords | コーパス / 表記 / 近世語 / ルビ / 日本語史 |
Outline of Annual Research Achievements |
本研究は、江戸時代後期に流行した読本について、漢字表記とそれに対応するルビとの関係に着目して漢字かな交じりテキストとしての読本の表記の特質を捉えようとするものである。日本語史研究上重要な読本作品について形態論情報付きのコーパスを構築し、その形態論情報を用いて品詞・語種などの観点から漢字・仮名の使い分けや漢字に対するルビの付与状況などを精査する。2022年度は、研究計画に基づき以下の各項目について作業を進めた。 ①前年度までに完了しなかった作品のテキスト入力・XML化 ②ルビ(特に左ルビ)についてのXML仕様の検討 ③テキストデータを用いた形態素解析および形態論情報修正 ④上記作業中に生じた問題点について学会発表および論文執筆 ①~③については前年度から継続し、データの拡充・精緻化をはかるため作業を進めた。特に、漢字の左側に付されるルビ(左ルビ)の取り扱いについて『日本語歴史コーパス』江戸時代編のデータを参考に検討を行った。④については、国立国語研究所内のシンポジウムにおいて、個人でコーパスデータを構築する際のモデルケースの一つとして構築の進捗・課題について報告した。また、構築作業中に得た問題意識に基づき、読本における漢数字とルビの対応についての論文を執筆した。これは本研究の主眼の一つである本行の漢字とルビとの対応関係を捉えることを目指したもので、漢数字においては他の漢字とは異なるルビの用い方をしていることを明らかにした。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
テキスト入力・XML整備等の作業について自ら検討しながら進めたこと、また上記論文執筆に必要なデータの収集を優先したため、全体としてコーパス構築作業はやや遅れている。コーパス公開・論文執筆に必要なデータについて再検討を行い、次年度の作業をスムーズに行えるよう工夫した。
|
Strategy for Future Research Activity |
コーパス化するデータの量を調整し、作業者を確保することで進行の遅れているコーパスデータ構築を進める。また、コーパス公開に向け、国立国語研究所のプロジェクトで推進している個人によるコーパスデータの構築・公開に関する研究会等に積極的に参加し、適切な公開形式等について検討する。
|
Causes of Carryover |
コロナによる学会のオンライン開催が続き、旅費の使用が予定より減少した。また、作業者の確保が困難で作業分担を変更して対応したため、人件費・謝金の使用が当初予定を下回っている。作業協力者を確保し、コーパス公開に向けた作業を推進する予定である。
|