• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Research-status Report

「保護者としての日本語」の確立に向けた『幼稚園の配布文書コーパス』の構築と分析

Research Project

Project/Area Number 20K00730
Research InstitutionTokyo Metropolitan University

Principal Investigator

長谷川 守寿  東京都立大学, 人文科学研究科, 教授 (50272125)

Co-Investigator(Kenkyū-buntansha) 西尾 広美  大学共同利用機関法人人間文化研究機構国立国語研究所, 日本語教育研究領域, プロジェクト非常勤研究員 (10794232)
Project Period (FY) 2020-04-01 – 2025-03-31
Keywords幼稚園 / 配布文書 / やさしい日本語 / 海外につながりを持つ保護者
Outline of Annual Research Achievements

幼稚園の配布文書については、近年プライバシー保護の問題があり、交渉しても入手できるかどうか定かではなくなってきている。それに加え2020年度は、コロナ禍の影響があり、幼稚園に直接出向いて、配布文書入手のための交渉を行うことができなかった。
そこで、今年度はウェブサイト上で公開されている文書の収集を行うことにした。公開されているということは、公開元においてすでに公開に関する承諾がとれていると考えられ、使用者側でも最低限必要となる固有名の変更などを行うことで使用することが可能となると判断した。
昨今はウェブサイト上で幼稚園からのお知らせや各行事の様子を掲載することも多くなり、さらに入園手続きなども同様に公開されている。これらのページは海外につながりを持つ保護者が園選びの際に閲覧することも十分考えられ、調査対象として収集する意義は十分あると考える。また、紙で配付される文書とどのように違うのかも明らかにできるというメリットも考えられる。
実際には、ブラウザの検索機能を用いて、「幼稚園からのお知らせ」「園児の様子」に関するページを持つ園を検索した。その中から、ある程度まとまった情報が得られる幼稚園として市立の幼稚園(1)、私立幼稚園(3)が対象としてふさわしいと考え、収集した。情報収集の際には、なるべく全ての情報を収集できるように、ホームページの構造を確認しながら、収集した。PDFファイルで提供されているものはそのまま、html形式の場合は、PDFファイルとテキストファイルの形式で収集した。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

コロナ禍の影響があり、幼稚園と直接交渉し、配布文書を入手することができず、紙ベースの配布文書が増えていない。そのため、研究計画を一部変更しなければならなかった。

Strategy for Future Research Activity

現在、4園のホームページのデータを入手していて、常に更新中である。データのバランスを考慮して、さらに公立の幼稚園(2)を追加する予定である。
現在はデータの整理中である。整理においては、2点を心がけている。まずは、データの抜けがないことと、データの重複がないことである。これらは、今後データ処理を行う際に、重要となっていく点である。まず、データの抜けであるが、園によっては、データが階層構造をなしておらず、別の所にデータが置かれている例もあり、それらの抜けがないように確認する。データの重複であるが、例えばある行事に関する報告が、その月のアーカイブにまとめられていることがある。量的研究において大きな問題なので、データの重複がないように確認している。調査用データの形式としては、PDFファイルでのみ公開されている文書については、テキスト文書に変更し、どのような属性を持つか名前から判明するようにファイル名を変更する。
今後の研究として、本格的な語彙調査に入る前に、形式の面から考えられる問題を明らかにする。手続きとしては、表記の多様性の問題を明らかにし、その成果として表記が統一された調査用データ作成を行う。

Causes of Carryover

コロナ禍で学会の研究発表がオンラインになり、旅費の支出がなくなった。また、資料の交渉・借り受けに、幼稚園へ出向くことができなかった。よって配布文書入手もかなわず、テキスト化の費用も使用することがなかった。
次年度は、紙ベースの配布文書が入手できる見込みが立ったので、そのテキスト化の経費に予算の大半を充てる予定である。

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi