研究課題/領域番号 |
16K00489
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
学習支援システム
|
研究機関 | 津田塾大学 |
研究代表者 |
来住 伸子 津田塾大学, 学芸学部, 教授 (50245990)
|
研究分担者 |
岸 康人 神奈川大学, 付置研究所, 研究員 (50552999)
田近 裕子 津田塾大学, 総合政策学部, 教授 (80188268)
久島 智津子 津田塾大学, 言語文化研究所, 研究員 (80623876)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
研究課題ステータス |
完了 (2019年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2018年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2017年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2016年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
|
キーワード | 英語学習 / 文書類似度 / 文書分類 / 潜在意味解析 / 教材自動生成 / 機械学習 / 語彙学習 / Latent Semantic Analysis / 教材自動作成 / 教材作成 / 教材生成 / 学習コンテンツ開発支援 |
研究成果の概要 |
この研究では、潜在意味解析、語頻度、語頻度・逆文書頻度の3種類の文書類似度評価方法を利用して、英語学習者の興味や習熟度に適した用例を自動生成し、実際に学習者が用例を評価することを目指した。使用ハードウェア、ソフトウェアの改善により、先行研究より文書類似度計算を高速化できた。用例の難易度の推定にも、文書類似度を利用することにし、難易度の異なる複数の文書集合との距離から難易度を推定することにした。その結果、文書集合の種類や大きさが先行研究より増大した。そこで、潜在意味解析だけでなく、他の類似度計算方法、word2vecなどの浅い機械学習による類似度評価方法も利用することにした。
|
研究成果の学術的意義や社会的意義 |
この研究は、第2言語として英語を学ぶ学習者に、学習者の興味や習熟度にあった教材を自動生成する研究の一環として行っている。社会人や大学生の英語学習者の場合、本人の仕事や専門分野で実際に使われる表現の習得を効率的に行うことが望ましいが、適した教材(教科書、書籍、動画など)は非常に少ない。一方、Wikipediaや各種オープンコンテンツの普及により、英語テキストは入手しやすくなっている。そこで、情報検索分野で使われている、潜在意味解析、頻度分析などの手法を利用して、大規模テキストデータから、教材の素材となる用例(英語の分離)の自動抽出を行った。
|