2019 Fiscal Year Research-status Report
Project/Area Number |
19K13211
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
片山 久留美 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, プロジェクト非常勤研究員 (10803778)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | コーパス / 表記 / 近世語 / 読本 / ルビ / 日本語史 |
Outline of Annual Research Achievements |
本研究は、江戸時代後期に流行した読本について、特に本行の漢字表記とそれに対応するルビとの関係に着目して漢字仮名交じりテキストとしての読本の表記の特質を捉えようとするものである。刊行年や作者の異なる複数の作品に対して、語ごとに品詞や語種などの形態論情報を付与したコーパスを作成し、書かれている語の性質と対応する表記との関係を考察する。全文に形態論情報を付与したコーパスを用いることで、漢字表記箇所だけでなく仮名表記箇所についても包括的に扱うことが可能となる。2019年度は、以下の各項目を行った。 1.コーパス化の対象となる資料の選定および版本・翻刻などの資料の入手や所在確認を行った。あわせて、本研究に関連する研究文献、特にルビと漢字表記との対応関係を検討する上で重要な白話語彙に関する先行研究を収集した。 2.コーパス作成のためのテキストの入力仕様を検討し、一部作品のテキストデータ化に着手した。コーパス化の対象とする範囲の選定や、XML構造化に向け必要となる情報や想定される文書構造の検討を行った。 3.テキストデータ化と並行し、形態素解析のためのXMLの仕様の検討を行った。XMLについては国立国語研究所の『日本語歴史コーパス』江戸時代編などの仕様を参考にしているが、本研究の目的に適した形式となるよう検討・修正を施した。特に、漢字表記箇所と対応するルビ部分について多重に形態論情報を付与するための仕様を検討し、試行を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
テキストデータ入力を依頼する作業者の確保が難しかったため、当初の作業計画から遅れが生じている。ただし、白話語彙についての先行研究の整理など、今後必要となる作業を進めるよう努めた。
|
Strategy for Future Research Activity |
テキストデータ入力は外部業者への依頼も検討し、入力を進める。テキストデータのできた作品から順次XML化・形態素解析等を行うこととする。また、2019年度はデータ構築の仕様検討に時間を要し、成果発表に至ることができなかったため、本年度は整備過程を踏まえた研究発表を積極的に行う。
|
Causes of Carryover |
データ入力を行う作業者が確保できなかったため、「人件費・謝金」として計上した分の計画に変更が生じた。これについては次年度に行う作業に当たる作業者等への謝金とする予定である。
|