研究課題/領域番号 |
16K00489
|
研究機関 | 津田塾大学 |
研究代表者 |
来住 伸子 津田塾大学, 学芸学部, 教授 (50245990)
|
研究分担者 |
岸 康人 神奈川大学, 付置研究所, 研究員 (50552999)
田近 裕子 津田塾大学, 総合政策学部, 教授 (80188268)
久島 智津子 津田塾大学, 言語文化研究所, 研究員 (80623876)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 英語学習 / 教材生成 / 文書類似度 / 文書分類 / 潜在意味解析 |
研究実績の概要 |
この研究では、潜在意味解析(Latent Semantic Analysis)、語頻度、語頻度・逆文書頻度(tf-idf)の3種類の文書類似度評価方法を利用して、英語学習者の興味や習熟度に適した用例を自動生成することを目指している。先行研究では、潜在意味解析が、専門用語の多い英語表現の分類に利用できることを確認してある。この研究では、実際の英語教育に実用的に利用できることをめざして、対象とする文書集合の大規模化と、文書や用例の難易度の自動分類に取り組んでいる。とくに、潜在意味解析による文書類似度評価の高速化と、学習者の習熟度と用例の自動対応に取り組んでいる。 平成29年度は、高速化計画の一環として、サーバーを購入し、整備を開始した。サーバーの購入の一環として、機種や構成の選定作業を行った。研究申請を行ったころは、Python による大規模行列計算にGPUを利用することを考えていなかったが、ここ1、2年で低価格化がすすみ、GPUをつかった最低限の行列計算もできるような構成で購入した。さらに、サーバ整備の一環として、各種Python のフレームワークを検討した。 学習者の習熟度に合わせた用例の難易度分類については先行研究のサーベイを行ったが、語彙分類だけでは難しいということが再確認できた。文法、文脈、学習者の持っている知識(スキーマ)などをある程度考慮し、かつ、自動化に向いた方法の検討を継続している。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
サーバーの構成の検討に予想以上に時間がかかった。また、難易度の分類方法について、適切、かつ実用的なものが見つからな状態であるため。
|
今後の研究の推進方策 |
昨年の推進方策にも同じことを書いたが、研究期間も限られているので、実現可能な方法で難易度推定は妥協して実施することを検討する。
|
次年度使用額が生じた理由 |
サーバーの購入は実施したが、サーバーを使用したソフトウェア開発を延期したため、ソフトウェア開発費用の大部分を繰り越しした。
|