• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2018 年度 実施状況報告書

英学資料のテキストデータ化に関する研究

研究課題

研究課題/領域番号 17K02786
研究機関白百合女子大学

研究代表者

常盤 智子  白百合女子大学, 文学部, 教授 (60361557)

研究期間 (年度) 2017-04-01 – 2020-03-31
キーワード日本語史 / 英学資料 / データ化
研究実績の概要

本年度は、昨年度対象資料として選定した『春秋雑誌 会話篇』(英学資料『Kuaiwa Hen』(明治6年刊)の国字テキスト)に対して、データの作成とタグ(メタデータ:コーパスなどの大規模データの検索等に参照され得るデータ)の入力を行った。
作業は、作業協力者とともにテキストデータに対して、どのタグをどのようにつけていくのかという検討・調整を行いつつ進めた。実際に作業してみると、想定していない問題もままみられ、データ化の難しさを知ることとなった。特に後半のルビ付きの漢字仮名交りテキストはルビや送り仮名を中心に、自由度の高い表記(当時としては当然の表記と考えられる)がみられることから、その処理について苦慮することも多かった。そこで、データ整備、タグ付けの検討・試作に際しては、国立国語研究所の近藤明日子氏に協力を依頼し、国立国語研究所で公開されている日本語歴史コーパスにおけるタグ付けの詳細を学びつつ、作業ツールに関する情報提供や指導をいただく機会を得た。年度末には一通りのタグ付けを終えたものの、なお不明の点や、不統一の面が残っており、今後の調整が残る状況である。
上記の作業と並行し、英学資料や対象資料を日本語史の研究資料として活用する方法についても考察を行い、その成果の一つとして「幕末明治期における日英対訳会話書の日本語―数量の多さを表す句との対応から―」(『日本語の研究』第14巻2号)を公表した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

データ入力・点検、タグ入力・点検を行った。主なタグ入力については第一次入力は終了したが、今後、最終的な段階にまとめるまでには、タグ等についてなお調整の必要が残っている状態である。
ほぼ第二年度の計画通りに進めることができた。

今後の研究の推進方策

本年度は『Kuaiwa Hen』の国字データの完成と年度末の公開を目標として作業を進める予定である。広く活用できるデータの公表に向けて、作業協力者の確保、作業指導、作業点検など、調整をしつつ進めていきたい。
また、併行して、資料に関する日本語研究を行い、今後、本研究の成果を応用しうる資料についても見通しをつけていきたい。

次年度使用額が生じた理由

当初の予定していた作業協力者が、途中から作業できなくなったことと、その後の協力者の確保が十分にとれなかったことが理由の一つとしてあげられる。また、外部大学への図書閲覧の出張を予定していたが、こちらも日程等の調整がつかず、実施できなかったことがその理由であると考えられる。作業進行とも大いに関係のあるところなので作業協力者の確保と出張計画を早めに対応していきたいと考えている。

  • 研究成果

    (1件)

すべて 2018

すべて 雑誌論文 (1件) (うちオープンアクセス 1件)

  • [雑誌論文] 幕末明治期における日英対訳会話書の日本語 ──数量の多さを表す句との対応から──2018

    • 著者名/発表者名
      常盤智子
    • 雑誌名

      日本語の研究

      巻: 14-2 ページ: 18-33

    • DOI

      https://doi.org/10.20666/nihongonokenkyu.14.2_18

    • オープンアクセス

URL: 

公開日: 2019-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi