2023 Fiscal Year Research-status Report
Development of Readability Index for EFL Learners with Artificial Intelligence
Project/Area Number |
19K00902
|
Research Institution | Kagoshima National College of Technology |
Principal Investigator |
坂元 真理子 鹿児島工業高等専門学校, 一般教育科, 准教授 (60370061)
|
Project Period (FY) |
2019-04-01 – 2025-03-31
|
Keywords | 英語リーダビリティ / 機械学習 |
Outline of Annual Research Achievements |
本研究で使用してきた指標「OFYL(Ozasa/Fukui Year Level)」は一般に知られる英語母語話者向けの指標や主観的分類による指標とは一線を画し、測定値が日本の英語教育課程での学習学年レベルをほぼ直接示すという実用性と、統計による客観的信頼性の高さを兼ね備えた指標である。本研究ではこの指標の改良の過程において、英語教育の専門家が行った主観的評価による難易度判定という変数が担っていた部分を、機械学習をもって改良する。改良された指標は新学習指導要領に沿った、教育現場や学校外の英語学習環境で使用しやすい教材開発を強力に支援すると共に、これまで人間が多大な時間と労力を費やして構築せざるを得なかった作業を機械学習で代替するための画期的な方法を提示することになる。このリストの参考にするデータベースは、例えばネイティブ・コーパスのように母語話者の英語を参照するものを利用してしまってはOFYLの「日本語を母語とする英語学習者向けのツール」という目的を違えてしまうことになるため、敢えてAuthenticな英語を反映していないもの且つ莫大な量を有するデータである必要があった。本研究ではこの問題に対し、まず「EDR電子化辞書」の中から「英語共起辞書」を選択し、これを基にデータベースを作成することから始めた。昨年度はこの難易度リスト作成に使う辞書データの探索と、誤文系以外の文法項目を用いてリストを作成する試みについての試みを行った。また昨年度は、E D Rの英語共起辞書意外のより適切な辞書を探索し、Wikipediaのdumpデータを用いたデータベースの作成を行ったり、得られたデータベースから難易度リストを作成するにあたり自動化の予備実験を行った他、他の文法項目を用いてのデータの抽出を試みた。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
E D Rの英語共起辞書を用いたデータベース作成の過程とリーダビリティ測定ツールの現場での有効利用の可能性について実験結果を基にまとめ、当初は昨年度までに論文が公表される予定であったが、結果的にAIと高等教育に関する学会のシンポジウム(LiHE 2024 Symposium)に応募することとなり、このシンポジウムの開催時期が延期になった影響で進捗はやや遅れている。結果的には論文はアクセプトされたため、今年度はこのシンポジウムに参加し文章の修正と編集を重ねた上で、「AI in Higher Education; enhancing student motivation, engagement and learning」という本のうちの1つの章として掲載される予定である。 また、コロナ禍が明けてきた影響で出張や新たなプロジェクトの立ち上げ等の校務が多くなり、研究に割ける時間が全体的に減り気味であったことも理由として挙げられる。
|
Strategy for Future Research Activity |
今後は予備実験の結果をもとに、現実の話し言葉等による言い回しや表現などの流行に左右されないもので外国語としての英語にも対応でき、しかもできるだけ多くの項目を有しているという条件を兼ね備えた英語辞書データベースの探索を行うとともに、データベース作成の自動化がそのデータベースを基にできるようさらに思考を重ねていく予定である。また、研究の成果をまとめ、発表やジャーナル等への応募を行う予定である。辞書データの拡充とともに、難易度の評価データとしてどのような尺度を用いるかという問題もある。現在は抽出しやすい文法項目として関係代名詞やto不定詞を用いているが、これらは関連する単語として異なる用法を持っている上に文脈上で決定される場合もある。このような文法項目について抽出の精度を上げていく必要もある。 改良されたリーダビリティ測定指標を使用すると、興味を持ったトピックについて英語で書かれているインターネット上のテキストを使用して勉強したい学習者や、教師がいない大人の学習者にとって強力な学習補助ツールとなりうる。また、教師にとっても、自分が教えている学習者のレベルに合わせて適切な教材を容易かつ大量に用意することができる。
|
Causes of Carryover |
発表する予定であった学会を諸事情により変更したが、その変更した先の学会の開催時期が延期され、次年度にかかってしまったため。なお、この学会には発表内容は査読の後すでにアクセプトされ、シンポジウムに出席して編集者らとのやり取りの中から修正と編集を何度か行ったのち、出版予定の本の章の一つとなる予定である。
|