研究課題/領域番号 |
19K00902
|
研究機関 | 鹿児島工業高等専門学校 |
研究代表者 |
坂元 真理子 鹿児島工業高等専門学校, 一般教育科, 准教授 (60370061)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
キーワード | リーダビリティ / 機械学習 / 新学習指導要領 / 英語教科書 |
研究実績の概要 |
本研究の最終的な目的は、日本人の英語学習者のためのリーダビリティ指標である「Ozasa-Fukui Year Level Index (OFYL)」を、2020年より各教育課程において順次実施される新学習指導要領の規準に対応したものに改良することであり、これを機械学習を用いて行うということである。そのために今年度は、OFYLを構成するリストの改良を試みた。 OFYLの算定式は「一文あたりの語数」「一語あたりの音節数」「語の難易度」「一文あたりの熟語の難易度」から構成されているが、新学習指導要領に即した改良のためには、まず単語と熟語の難易度リストを新学習指導要領で出現する単語熟語に沿ったものに改良する必要がある。また機械学習を行うためには、リストのサイズは可能な限り大きい方が望ましいので、教科書に実際に出現するものだけでなくそれとなるべく似た質の単語熟語を集め、それらの難易度を付与したリストにする必要がある。 今年度は特に、最終的に機械学習を用いて改良をするためにこのリストを「英語共起辞書」を使用して作成することを目標とした。英語共起辞書はいわゆる市販の「辞書」とは異なりプログラミングで使用するためのデータベースで、語同士の共起関係とその意味役割の情報などを含んでいる。これを利用して、共起している語が出現する例文の文法構造を推測し、その文法項目から難易度を割り当ていることが可能であることを発見した。この結果は論文にまとめて国際学会に発表し、Proceedingsに掲載された。また、論文集にも投稿し、現在は査読結果を待っている状態である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
今年度は新学習指導要領に沿って作成された英語検定教科書を高校1年生の分までそろえ、データを取得することができた。そのデータを基にしたコレスポンデンス分析では、やはり今までの歴史的な英語教科書とは異なるタイプの教科書であるという結果が出ている。また、それと同時に上述の、OFYL自体の改良のために単語・熟語の難易度リストを改良するという試みが行われた。この単語・熟語の難易度リストは、英語教科書のリーダビリティ分析ツールを構成するものであるという性格上、新聞やネイティブスピーカーの会話などのナチュラルコーパスを使うことはできない。また、単語・熟語の難易度について英語教育の専門家が手動で難易度を割り当てるという工程を入れることは、人間の負担を軽減するという本研究の目的に反する。そのため、学校で使用する英語検定教科書の内容やレベルを十分に考慮しながら、機械学習を可能とするようなサイズを持つ辞書を探すことが最初の課題であった。その様な状況の中で今回は英語共起辞書を使用してリストの作成が可能かどうかを検証した。英語共起辞書は市販の辞書とは異なる構造を持っているため、本研究に携わる研究者及び研究協力者も手探りの状態でデータの加工や分析を行うこととなった。しかし、今年度の研究で得られた成果は、難易度リストに文法的な情報を盛り込める可能性を示唆するもので、客観的な情報を自動的に付加できるという意味で今後の辞書の再構築及び将来的な機械学習の導入のために重要な発見となった。 やや遅れていると評価した点は、リストの作成に使用する辞書の選定を今後も続ける必要があることが判明した点と、研究開始当初は、高校の英語教科書は1と2が令和4年度中に出版されるものと考えていたが、実は2が出版されるのは令和5年度であることが分かり、その分データベースの作成が計画より遅れることとなった点である。
|
今後の研究の推進方策 |
今後の研究としてはまず、今年度の成果をもとに、英語共起辞書から作成したデータベースの内容の精度を上げ、今回発見した文法情報の他にどのような文法項目の情報を使用できるかを一つ一つ吟味していくことを計画している。また、英語共起辞書の他にも相応しいと考えられるデータについて検討していく必要がある。上述の通り、検討すべきデータベースはまずある程度のサイズが必要であることと、ナチュラルコーパスや市販の教材のようなオーセンティックなものを避ける必要があるため、英語教科書のデータベースと整合性があると思われるものを注意深く吟味していくことが課題となる。英語検定教科書については、令和5年度に高校2年生の教科書が発行されるに伴い新学習指導要領に沿った教科書が一通り揃うこととなるので、小学校から高校まで全てが揃った教科書データベースを作成することができる。データベースを作成した後はそれを元に語や熟語の難易度リストの改良や教科書の計量的分析に使用する予定である。
|
次年度使用額が生じた理由 |
リーダビリティの算定式を改良するために使用するデータベースの構築に思いの外時間と費用がかかっている。また、学会発表や論文掲載費が令和5年度も必要となる見込みである。よって、英語検定教科書の高校2年生分のデータベース作成のために資材を購入する他、単語・熟語の難易度リストを拡充するにあたり辞書の元となるデータ類の購入と人件費、学会発表や論文掲載費に使用する予定である。
|