本研究の目的は日本語の文章における漢字使用の実態を通時的・計量的な観点から明らかにするために日本語の表記や語彙の研究に資する近現代小説コーパスとして芥川龍之介賞受賞作品(芥川賞作品)のコーパスを構築することである。この目的の達成に向けて今年度は実際に芥川賞作品のコーパスを構築する作業を継続すると共にコーパスを構築する方法論の整備にも取り組むこととした。 まず,昨年度に引き続いてコーパスを構築する作業を進めた。特に21世紀以降の新しい作品に重点を置き,対象とする本文を電子化した上で各語に分割して語種(和語・漢語・外来語)や品詞などの情報を認定する作業を実施した。なお,今年度は作業補助者を追加で募集し,作業を迅速に進められるように努めた。また,作業を進めるに当たっては昨年度に定めた作業用のマニュアルを作業補助者と事前に共有し,全体として一貫した処理になるように留意した。 次にコーパスを構築する方法論の整備を試みた。具体的には芥川賞作品のコーパスを構築するために考案した作業の手順について古典語のコーパスを構築する事例に適用し,その汎用性の高さを実証的に示した。また,既存のコーパスとの互換性に配慮したデータの管理方法や用例の検索方法についても昨年度に引き続いて検討し,その一部についてプログラミング言語Pythonを用いて実装した。更に両者の成果を合わせて研究発表を実施した。 研究期間全体を通しては実際に芥川賞作品のコーパスを構築する作業に取り組んだことに加え,コーパスを構築するに当たって生じ得る問題を整理した上で一定の解決を見込める手順を提示したことやコーパスを構築する作業を進めるに当たって汎用性の高い手順を考案したことが本研究の中心的な成果であると言える。また,これはコーパスに基づいて日本語の文章における漢字使用の実態を明らかにするための一助となるものである。
|