Development of Readability Index for EFL Learners with Artificial Intelligence
Project/Area Number |
19K00902
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 02100:Foreign language education-related
|
Research Institution | Kagoshima National College of Technology |
Principal Investigator |
坂元 真理子 鹿児島工業高等専門学校, 一般教育科, 准教授 (60370061)
|
Project Period (FY) |
2019-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥2,730,000 (Direct Cost: ¥2,100,000、Indirect Cost: ¥630,000)
Fiscal Year 2022: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2021: ¥390,000 (Direct Cost: ¥300,000、Indirect Cost: ¥90,000)
Fiscal Year 2020: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2019: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
|
Keywords | 英語リーダビリティ / 機械学習 / リーダビリティ / 新学習指導要領 / 英語教科書 / 英語教科書分析 / リーダビリティツール / 小学校英語教科書 / 教科書分析 / 人工知能 / 外国人英語学習者 |
Outline of Research at the Start |
本研究は日本人英語学習者のための文章の客観的難易度指標(OFYL)を人工知能(AI)を用い、2020年からの新学習指導要領の規準に対応できるよう改良し、日本の教育課程で英語を学ぶ/学んだ学習者の読解学習をさらに促進させるツールを開発する事を目的とする。 改良されたリーダビリティ指標は新学習指導要領に沿って、日本の英語教育現場内外の学習者が使用し易い読解教材開発を強力に支援すると共に、これまでヒトが多大な時間と労力を費やして構築せざるを得なかった作業をAIで行うという負担軽減の具体的な方法を提示することになる。この指標は誰もが英語学習に役立てられるようネット上に一般公開する。
|
Outline of Annual Research Achievements |
本研究で使用してきた指標「OFYL(Ozasa/Fukui Year Level)」は一般に知られる英語母語話者向けの指標や主観的分類による指標とは一線を画し、測定値が日本の英語教育課程での学習学年レベルをほぼ直接示すという実用性と、統計による客観的信頼性の高さを兼ね備えた指標である。本研究ではこの指標の改良の過程において、英語教育の専門家が行った主観的評価による難易度判定という変数が担っていた部分を、機械学習をもって改良する。改良された指標は新学習指導要領に沿った、教育現場や学校外の英語学習環境で使用しやすい教材開発を強力に支援すると共に、これまで人間が多大な時間と労力を費やして構築せざるを得なかった作業を機械学習で代替するための画期的な方法を提示することになる。このリストの参考にするデータベースは、例えばネイティブ・コーパスのように母語話者の英語を参照するものを利用してしまってはOFYLの「日本語を母語とする英語学習者向けのツール」という目的を違えてしまうことになるため、敢えてAuthenticな英語を反映していないもの且つ莫大な量を有するデータである必要があった。本研究ではこの問題に対し、まず「EDR電子化辞書」の中から「英語共起辞書」を選択し、これを基にデータベースを作成することから始めた。昨年度はこの難易度リスト作成に使う辞書データの探索と、誤文系以外の文法項目を用いてリストを作成する試みについての試みを行った。また昨年度は、E D Rの英語共起辞書意外のより適切な辞書を探索し、Wikipediaのdumpデータを用いたデータベースの作成を行ったり、得られたデータベースから難易度リストを作成するにあたり自動化の予備実験を行った他、他の文法項目を用いてのデータの抽出を試みた。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
E D Rの英語共起辞書を用いたデータベース作成の過程とリーダビリティ測定ツールの現場での有効利用の可能性について実験結果を基にまとめ、当初は昨年度までに論文が公表される予定であったが、結果的にAIと高等教育に関する学会のシンポジウム(LiHE 2024 Symposium)に応募することとなり、このシンポジウムの開催時期が延期になった影響で進捗はやや遅れている。結果的には論文はアクセプトされたため、今年度はこのシンポジウムに参加し文章の修正と編集を重ねた上で、「AI in Higher Education; enhancing student motivation, engagement and learning」という本のうちの1つの章として掲載される予定である。 また、コロナ禍が明けてきた影響で出張や新たなプロジェクトの立ち上げ等の校務が多くなり、研究に割ける時間が全体的に減り気味であったことも理由として挙げられる。
|
Strategy for Future Research Activity |
今後は予備実験の結果をもとに、現実の話し言葉等による言い回しや表現などの流行に左右されないもので外国語としての英語にも対応でき、しかもできるだけ多くの項目を有しているという条件を兼ね備えた英語辞書データベースの探索を行うとともに、データベース作成の自動化がそのデータベースを基にできるようさらに思考を重ねていく予定である。また、研究の成果をまとめ、発表やジャーナル等への応募を行う予定である。辞書データの拡充とともに、難易度の評価データとしてどのような尺度を用いるかという問題もある。現在は抽出しやすい文法項目として関係代名詞やto不定詞を用いているが、これらは関連する単語として異なる用法を持っている上に文脈上で決定される場合もある。このような文法項目について抽出の精度を上げていく必要もある。 改良されたリーダビリティ測定指標を使用すると、興味を持ったトピックについて英語で書かれているインターネット上のテキストを使用して勉強したい学習者や、教師がいない大人の学習者にとって強力な学習補助ツールとなりうる。また、教師にとっても、自分が教えている学習者のレベルに合わせて適切な教材を容易かつ大量に用意することができる。
|
Report
(5 results)
Research Products
(2 results)