2022 Fiscal Year Research-status Report
日本語の文章における漢字使用の実態を解明するための近現代小説コーパスの構築
Project/Area Number |
22K19985
|
Research Institution | University of Tsukuba |
Principal Investigator |
菅野 倫匡 筑波大学, 人文社会系, 助教 (30961651)
|
Project Period (FY) |
2022-08-31 – 2024-03-31
|
Keywords | 表記 / 漢字使用の実態 / 芥川賞作品 / コーパス |
Outline of Annual Research Achievements |
本研究の目的は日本語の文章における漢字使用の実態を通時的・計量的な観点から明らかにするために日本語の表記や語彙の研究に資する近現代小説コーパスとして芥川龍之介賞受賞作品(芥川賞作品)のコーパスを構築することである。この目的の達成に向けて今年度はコーパスを構築する際に生じ得る問題について改めて整理した上で実際に芥川賞作品のコーパスを構築する作業に取り組むこととした。 まず,コーパスを構築するに当たっては読み方の定まらない語が問題となることから本研究では暫定的な読み方を定めるために既に提示した方法について同時代の資料に幅広く適用し得る汎用的な手順として再整理した。また,読み方の定まらないものに該当する語例についても最も典型的なものと考えられる2字の漢字表記語となる名詞を中心として具体的に整理を試み,両者の成果を合わせて論文として公表した。 次に実際にコーパスを構築する作業に着手した。既に数作品については対象とする本文を電子化した上で各語に分割して語種(和語・漢語・外来語)や品詞などの情報を認定する作業を完了した。なお,作業を進めるに当たっては事前に作業用のマニュアルを定めて手順を明確化し,必要に応じて修正を加えつつ全体として一貫した処理になるように努めた。また,既存のコーパスとの互換性に配慮したデータの管理方法や用例の検索方法についても併せて検討し,今後のコーパスの拡充や活用に向けた環境の整備を進めた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
コーパスを構築するに当たって生じ得る問題について整理し,一定の解決を見込める手順や注意を要する具体的な語例の提示を試み,それを既に成果として公表し得たことは当初の想定よりも進展したと言える。 また,実際にコーパスを構築する作業にも着手しており,概ね順調である。なお,完了した作品が多くないことは1年目の研究期間が短いこと,それに伴って作業補助者の確保が遅れたことの2点に起因しているものと考えられることから大きな問題はないと考えている。 これを踏まえ,全体としては「おおむね順調に進展している」と判断した。
|
Strategy for Future Research Activity |
まずは本文を電子化した上で各語に分割して語種や品詞などの情報を認定する作業を各作品について進めることに注力する。また,コーパスを構築するに当たって生じ得る問題の検討や既に定めた手順の見直しにも必要に応じて取り組む。更にコーパスの管理方法や検索方法についても継続的に検討を重ねると共に作業が完了した作品を対象に表記や語彙について分析することにも着手する。
|
Causes of Carryover |
1年目の研究期間が短いこと,それに伴って作業補助者の確保が遅れたことの2点により,人件費・謝金の支出が当初の想定よりも少額に留まったことから次年度使用額が生じた。 当初の計画を後ろ倒しにすることになるが,使途については変更せず,作業補助者に支払う人件費・謝金として支出することを見込んでいる。
|