研究課題/領域番号 |
16K00489
|
研究機関 | 津田塾大学 |
研究代表者 |
来住 伸子 津田塾大学, 学芸学部, 教授 (50245990)
|
研究分担者 |
岸 康人 神奈川大学, 付置研究所, 研究員 (50552999)
田近 裕子 津田塾大学, 学芸学部, 教授 (80188268)
久島 智津子 津田塾大学, 付置研究所, 研究員 (80623876)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 英語学習 / 教材生成 / 文書類似度 / 文書分類 |
研究実績の概要 |
この研究では、潜在意味解析、語頻度、語頻度・逆文書頻度の3種類の文書類似度評価方法を利用して、英語学習者に、興味や難易度の面で適した用例を自動生成することを目的としている。先行研究では、潜在意味解析が、専門用語の多い表現の分類に利用できることを確かめている。この研究では、用例の実用化、実際の英語教育に利用できる用例の自動生成を目指している。特に、潜在意味解析等の文書類似度評価の高速化と、用例の難易度の分類の実現に主に取り組んでいる。 平成28年度は、1)高速化のためのテキストデータ解析用サーバーの購入と整備、と2)用例の英語教育専門家による評価、の2点を行う予定であった。 1)のサーバーの購入と整備に関しては、サーバー構成の検討を行った。検討作業として、使用するライブラリ等のバージョンアップ、データベースの再設計などを行っ性能評価を行った。しかし、検討が年度内に終わらず、サーバの購入に至っていない。 2)の用例の英語教育専門家による評価は、実際の英文書籍を利用して、日本の大学2年生に分かりにくい英語表現、文法構造、固有名詞などについて、英語教員から聞き取り調査を行った。先行研究で「使われる可能性の高い」用例の抽出はできるようになってきたが、抽出した用例を「易しい」用例と「難しい」用例の分類する方法は、まだ模索中である。教員だけでなく、学習者(学生)からは、アンケートによる語彙評価を実施する予定であったが、用例の「難易度分類」が曖昧な状況であったため、今年度は見送ることにした。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
先行研究で行った「使われる可能性の高い」用例の抽出より、用例の「難易度」の分類は難しい問題であるため、検討に時間がかかっている。また、時間配分がうまく行かず、サーバー構成の検討に十分な時間がさけず、購入を延期した。
|
今後の研究の推進方策 |
学習者向けの「難易度」の分類については、簡易的手法ですませ、高速化を主目的とした、サーバーの構築と整備を行う。
|
次年度使用額が生じた理由 |
サーバー購入を予定していたが、検討に時間がかかり、購入を延期したため。
|
次年度使用額の使用計画 |
平成29年度中にサーバーを購入する予定。
|