2021 Fiscal Year Research-status Report
Project/Area Number |
21K00635
|
Research Institution | Aichi Shukutoku University |
Principal Investigator |
山本 裕子 愛知淑徳大学, 交流文化学部, 教授 (20410657)
|
Co-Investigator(Kenkyū-buntansha) |
鷲見 幸美 名古屋大学, 人文学研究科, 准教授 (50340211)
川口 直巳 愛知教育大学, 教育学部, 准教授 (60509149)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 小学校教科書語彙 / 外国人児童 / 教科学習 / 社会科 / 形態素解析 / 出現頻度 / 誤解析 / 学習支援環境 |
Outline of Annual Research Achievements |
本研究の目的は、外国人児童の日本語学習に役立つ支援環境をweb上に構築し、教科学習につながる日本語学習支援の方策を提案することにある。具体的には、小学校の教科書に用いられている語彙を対象に、1)学年・教科ごとに分類された学習語彙リストを作成し、2)教科ごとに異なる単語の使われ方や意味の違いを踏まえた学習支援システムを開発することで、3)教科学習につながる学習支援環境を構築することを目指している。 2021年度は、小学校の教科書で用いられる学習語彙リストを作成するための手順を確立することを目指し、まず社会科について1年生から6年生までの語彙を取り出す作業を行った。当初の予定では、小学校で学習する漢字の学年配当を考慮した小学表記のまま教科書本文を形態素解析するツールを開発し、語彙を切り出すつもりであった。しかし、小学表記でも解析に問題ない単語がある一方で、一般表記でも切り損ねや品詞や読みの誤りがある等、解析に問題が生じる場合もあった。そこで、まず、解析エラーが生じる箇所をチェックし記録するツール(MeCab解析結果チェックツール)を開発した。このツールを用いて、1年生から6年生までの社会科の教科書本文の解析を行い、誤解析の生じた箇所を逐一記録した。その結果をもとに、誤解析を減らす仕組みを整えた上で、語彙の出現頻度が記録できる「単語頻度リスト作成ツール」を開発した。得られた単語頻度リストに、上記の仕組みで対応できなかった誤解析箇所の修正を行った上で、各学年の社会科教科書の語彙リストを作成した。さらに、どのレベルで「見出し語」にしていくかの検討を行った。 現在、学年ごとのリストを統合し、一つにまとめるための結合ツールを開発中である。これにより、全学年の語彙の重なりと異なりを判断して一つのファイルにまとめられるようになる。また、他の教科についても同様の手順で作業を進めていく予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
教科書の本文データに形態素解析をかけて、単語を切り出す過程で想定以上に問題が多く、問題を解消するためのツールを開発する必要が生じた。2種類のツールを開発し、一学年分の語彙を切り出したところで、何を「見出し語」にすべきであるかという問題について検討する必要があることがわかった。本研究で形態素解析に用いたMecab-Unidicでは、基本的には短単位が基準となっているため、たとえば「図書館」は「図書」と「館」に分かれてしまう。しかし、一般には「図書館」で一つの語と認知されているため、「図書館」を見出しにしたほうが適切だと考えられる。その一方で、接尾辞の付くものを異なる語として、すべて列挙すると、見出し語の数が非常に多くなってしまう。また、「美術館」「博物館」といった「館」のつく単語をまとめて提示することができれば、言葉の成り立ちにも意識を向けることが可能になる。この両方を満足させうるリストとして、「見出し語」の設定をどのようにするかを検討するのに時間を要した。そのため、一教科を対象とする分析にとどまった。
|
Strategy for Future Research Activity |
2022年度は、前年度開発した2つのツールと現在作成中のツールを用いて、語彙リスト作成の手順を確立する。手順確立後、その方法を用いて、他の教科の語彙リスト作成を進める。その際、教科書本文のデータをコーパス分析システムCo-Chuに取り込み、Co-Chuを使って複合語の抽出を行い、リストに複合語情報を加えるようにする。 並行して、外国人児童の学習支援現場の協力を仰ぎ、語彙リストの効果的な活用方法の検討を開始する。 また、語彙リスト作成過程で得られた研究成果について、関連する学会で発表する予定である。
|
Causes of Carryover |
コロナウイルス感染症の影響により、学会がオンライン開催になり、当初予定した旅費が不要となった。 来年度は、ツールを開発するための経費およびデータ分析に係る謝金に加え、開発したツールの運用実験に使用するために器材を購入する計画である。 また、学習支援の実践者を訪問し、聞き取り調査等を行う予定であるので、その旅費、謝礼等にも使用する計画である。
|
Research Products
(10 results)