2023 Fiscal Year Research-status Report
拡張した近代語コーパスを使用した口語体実用文の成立過程の計量的研究
Project/Area Number |
21K00552
|
Research Institution | The University of Tokyo |
Principal Investigator |
近藤 明日子 東京大学, 大学院人文社会系研究科(文学部), 助教 (30425722)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Keywords | 近代語 / 実用文 / 通時的変化 / コーパス / 文体 |
Outline of Annual Research Achievements |
本研究の目的は、明治・大正期に実用文(論説文・報道文等の非文芸ジャンルの文章)において口語体が萌芽し定着にいたるまでの変化の実態を、コーパスを資料として実証的に明らかにすることである。その達成のため2023年度は次の2点を実施した。 1. コーパス化の十分進んでいない明治10年代後半から20年代前半までの口語体実用文のコーパスデータを構築するため、以下のことを行った。(1) 『東洋学芸雑誌』『国民之友』の口語体記事の電子テキストについて、XMLによるアノテーションを行った。(2) 作成したXMLファイルの形態素解析を行い、そのデータをデータベースに格納した。(3) データベースに格納したデータの内、形態論情報を人手により修正し高精度化する作業に着手した。 2. 国内シンポジウムにおいて本研究におけるコーパスデータの構築進捗を報告した。その中で、『東洋学芸雑誌』『国民之友』の口語体記事の形態素解析結果と『日本語歴史コーパス 明治・大正編I雑誌』を使用して、明治10年代後半~明治20年代後半における名詞・形状詞に下接する文末辞の語形と文体の通時的変化について分析した。その結果、(1) 明治10年代後半の『東洋学芸雑誌』では「です」と「なり」が共存する文語体・口語体(敬体)の混在体が主流、(2) 明治20年代前半の『国民之友』では、「です」を使用する敬体が主流、(3) 明治20年代後半の『太陽』では、「であります」「である/でない」を主に使用する敬体あるいは敬体・常体の混在体が主流、であることを明らかにした。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
コーパスデータ作成について、作業補助を依頼する適任者が十分に得られず、昨年度に生じた遅れを取り戻せなかった。
|
Strategy for Future Research Activity |
データベースに格納したコーパスデータの内、形態論情報を手作業により修正し高精度化を図り、データを完成させる。 コーパスデータの公開準備を行う。 コーパスデータに基づき、口語体実用文の通時的変化を明らかにするための分析を行い、その結果を学会発表し、論文執筆の準備を行う。
|
Causes of Carryover |
コーパスデータ作成の補助者が十分に確保できず謝金の支出が少なかったため、次年度使用額が生じた。次年度の残されたデータ作成において、補助者に対する謝金として使用する計画である。 また、完成したデータに基づく分析に必要な物品費、研究成果発表のための旅費に利用する計画である。
|
Research Products
(1 results)