研究課題/領域番号 |
17K13469
|
研究機関 | 東京大学 |
研究代表者 |
鴻野 知暁 東京大学, 大学院人文社会系研究科(文学部), 助教 (30751515)
|
研究期間 (年度) |
2017-04-01 – 2021-03-31
|
キーワード | 日本語史 / 係り結び / コーパス / アノテーション |
研究実績の概要 |
本年度は、国立国語研究所で「日本語歴史コーパス 鎌倉時代編」として公開されている、『今昔物語集本朝部』(50万語)と『宇治拾遺物語』(10万語)のコーパスへのアノテーションを検討し、実際に付与作業を行った。具体的には、奈良時代・平安時代と同様に、1.長単位をベースとした係り句と結び句の範囲、2.係助詞と共起する疑問語、3.係り結びとその後続句との接続関係(「逆接」と「注釈」)といった情報を上記2種のコーパスデータに付与した。平安時代のデータを再確認する途中で、「いかが」のように副詞と係助詞とが融合している例が漏れていることが判明した。これに類似している例を調査し、アノテーションを見直すことでデータの完成度を高めた。上記作業によって、当初計画していた、奈良時代から鎌倉時代をカバーする通時的な係り結びのアノテーションが達成された。 『今昔物語集』では係り結びの異例となるものが散見した。岩波書店日本古典文学大系版の「解説」を参考にし、異例のパターンについて整理した。作業者からのフィードバックを受けつつ、問題となる例を処理した。 本研究で作成したデータベースを、他の研究者にも利用可能な形で公開する手段について検討した。「サンプルID」(コーパス内での)と「開始位置」(サンプル先頭からの文字位置)の2組の情報によって「日本語歴史コーパス」に紐付けることを計画し、データベースの拡充を実行した。 これまで作成したデータベースを活用し、奈良時代から平安時代にかけてコソの係り結びがいかなる逆接性を有しているかを考え、逆接表現の意味分類について口頭発表を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
予定通り、鎌倉時代2作品のコーパスデータへのマークアップ作業を完了した。また、奈良時代・平安時代のデータを再確認することでデータベースの完成度を高めることができた。
|
今後の研究の推進方策 |
当初計画していた言語資料のアノテーションは全て完了したが、更なるデータの拡充に向けて、平安時代の『大鏡』(7万語)などのアノテーションを行う予定である。これまで作成したデータの内容を再度確認し、公開に向けて整備を進めていく。作成したデータベースを活用し、係り結びの異例について通時的研究を行う。
|