• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

文書類似度を利用した英語学習用例の自動生成

Research Project

Project/Area Number 16K00489
Research InstitutionTsuda College

Principal Investigator

来住 伸子  津田塾大学, 学芸学部, 教授 (50245990)

Co-Investigator(Kenkyū-buntansha) 岸 康人  神奈川大学, 付置研究所, 研究員 (50552999)
田近 裕子  津田塾大学, 学芸学部, 教授 (80188268)
久島 智津子  津田塾大学, 付置研究所, 研究員 (80623876)
Project Period (FY) 2016-04-01 – 2019-03-31
Keywords英語学習 / 教材生成 / 文書類似度 / 文書分類
Outline of Annual Research Achievements

この研究では、潜在意味解析、語頻度、語頻度・逆文書頻度の3種類の文書類似度評価方法を利用して、英語学習者に、興味や難易度の面で適した用例を自動生成することを目的としている。先行研究では、潜在意味解析が、専門用語の多い表現の分類に利用できることを確かめている。この研究では、用例の実用化、実際の英語教育に利用できる用例の自動生成を目指している。特に、潜在意味解析等の文書類似度評価の高速化と、用例の難易度の分類の実現に主に取り組んでいる。
平成28年度は、1)高速化のためのテキストデータ解析用サーバーの購入と整備、と2)用例の英語教育専門家による評価、の2点を行う予定であった。
1)のサーバーの購入と整備に関しては、サーバー構成の検討を行った。検討作業として、使用するライブラリ等のバージョンアップ、データベースの再設計などを行っ性能評価を行った。しかし、検討が年度内に終わらず、サーバの購入に至っていない。
2)の用例の英語教育専門家による評価は、実際の英文書籍を利用して、日本の大学2年生に分かりにくい英語表現、文法構造、固有名詞などについて、英語教員から聞き取り調査を行った。先行研究で「使われる可能性の高い」用例の抽出はできるようになってきたが、抽出した用例を「易しい」用例と「難しい」用例の分類する方法は、まだ模索中である。教員だけでなく、学習者(学生)からは、アンケートによる語彙評価を実施する予定であったが、用例の「難易度分類」が曖昧な状況であったため、今年度は見送ることにした。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

先行研究で行った「使われる可能性の高い」用例の抽出より、用例の「難易度」の分類は難しい問題であるため、検討に時間がかかっている。また、時間配分がうまく行かず、サーバー構成の検討に十分な時間がさけず、購入を延期した。

Strategy for Future Research Activity

学習者向けの「難易度」の分類については、簡易的手法ですませ、高速化を主目的とした、サーバーの構築と整備を行う。

Causes of Carryover

サーバー購入を予定していたが、検討に時間がかかり、購入を延期したため。

Expenditure Plan for Carryover Budget

平成29年度中にサーバーを購入する予定。

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi