研究課題/領域番号 |
19K00924
|
研究機関 | ヤマザキ動物看護大学 |
研究代表者 |
大橋 由紀子 ヤマザキ動物看護大学, 動物看護学部, 准教授 (40589793)
|
研究分担者 |
投野 由紀夫 東京外国語大学, 大学院総合国際学研究院, 教授 (10211393)
片桐 徳昭 北海道教育大学, 教育学部, 教授 (60734829)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | 授業コーパス / 談話分析 / 語彙 |
研究実績の概要 |
2021年は授業コーパス構築のためのツール開発研究を行った。授業コーパス構築に要するタグ付けは通常のテキストコーパス構築よりも時間がかかる理由として、話者タグ、活動タグなど全てのタグ付与を手動で行わなければならない点が挙げられる。現在までに構築したコーパスは、全てのタグ付与を手作業で行っており、コーパス構築に多くの時間と労力を要した。そこで2021年は、今後大規模コーパス構築を目指すうえでのハードルとなっている手作業の負担を減らすべく、授業コーパス構築に要する話者・使用言語・活動等に関するタグのうち、話者タグ付与を自動化するツールとして、文字起こしされた各発話に対してタグを自動生成するClassroom Corpus Tagger (CCT)を開発した。CCTはJavaScriptを利用、ブラウザで作動し、日本語か英語を自動的に判別して言語タグを付与する。話者タグは任意に複数種類の設定が可能である。これにより授業コーパス構築が容易となる。手動とCCTでのタグ付けの妥当性の比較実験を行った結果、手動構築で見られるミスは、CCTを利用した場合は見られず、CCTを使用したタグ付けの正確性と、負担軽減が観察できた。成果発表として、日本英語コーパス学会 第47回大会にて口頭発表を行い、『英語コーパス学会大会予稿集 2021』 およびEnglish Corpus Studies: Vol. 29 にて論文発表を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
授業コーパス構築には大量の授業録画データを要するが、コロナ禍により学校訪問に規制が出たため、授業録画データ取得が叶わなかった。そのため、予定が遅れ気味である。
|
今後の研究の推進方策 |
現在Classroom Corpus Tagger (CCT)開発により、コーパス構築の準備は整っている。2022年よりコロナ規制が緩和されたことから、授業録画データ取得が期待できる。コーパス構築後の分析ツールに関してはCCTに続きCEFR-J wordlist準拠の語彙分析ツールを構築した(Vocabulary Analyzer based on CEFR-J wordlist for Self-Reflection: VACSR)。VACSRは授業コーパスを読み込み、CEFR-J wordlist各レベルに含まれる語彙の使用率を調査するツールである。これにより、授業コーパス構築後、各クラス間での語彙使用状況、使用語彙レベルの調査等の分析が容易になる。2022年は授業コーパス構築、データ分析を実施する予定であり、その準備は整っている。
|
次年度使用額が生じた理由 |
授業コーパス構築のためのデータ取得がコロナ禍により叶わなかったため、本研究の要であるコーパス構築が進められなかった。そのためデータ分析のためのツール構築を先行して行った。授業録画データ取得が予定通り進まなかったことから、本研究の進行に影響を与えたと考えられる。
|