2017 Fiscal Year Research-status Report
Project/Area Number |
16K00489
|
Research Institution | Tsuda University |
Principal Investigator |
来住 伸子 津田塾大学, 学芸学部, 教授 (50245990)
|
Co-Investigator(Kenkyū-buntansha) |
岸 康人 神奈川大学, 付置研究所, 研究員 (50552999)
田近 裕子 津田塾大学, 総合政策学部, 教授 (80188268)
久島 智津子 津田塾大学, 言語文化研究所, 研究員 (80623876)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 英語学習 / 教材生成 / 文書類似度 / 文書分類 / 潜在意味解析 |
Outline of Annual Research Achievements |
この研究では、潜在意味解析(Latent Semantic Analysis)、語頻度、語頻度・逆文書頻度(tf-idf)の3種類の文書類似度評価方法を利用して、英語学習者の興味や習熟度に適した用例を自動生成することを目指している。先行研究では、潜在意味解析が、専門用語の多い英語表現の分類に利用できることを確認してある。この研究では、実際の英語教育に実用的に利用できることをめざして、対象とする文書集合の大規模化と、文書や用例の難易度の自動分類に取り組んでいる。とくに、潜在意味解析による文書類似度評価の高速化と、学習者の習熟度と用例の自動対応に取り組んでいる。 平成29年度は、高速化計画の一環として、サーバーを購入し、整備を開始した。サーバーの購入の一環として、機種や構成の選定作業を行った。研究申請を行ったころは、Python による大規模行列計算にGPUを利用することを考えていなかったが、ここ1、2年で低価格化がすすみ、GPUをつかった最低限の行列計算もできるような構成で購入した。さらに、サーバ整備の一環として、各種Python のフレームワークを検討した。 学習者の習熟度に合わせた用例の難易度分類については先行研究のサーベイを行ったが、語彙分類だけでは難しいということが再確認できた。文法、文脈、学習者の持っている知識(スキーマ)などをある程度考慮し、かつ、自動化に向いた方法の検討を継続している。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
サーバーの構成の検討に予想以上に時間がかかった。また、難易度の分類方法について、適切、かつ実用的なものが見つからな状態であるため。
|
Strategy for Future Research Activity |
昨年の推進方策にも同じことを書いたが、研究期間も限られているので、実現可能な方法で難易度推定は妥協して実施することを検討する。
|
Causes of Carryover |
サーバーの購入は実施したが、サーバーを使用したソフトウェア開発を延期したため、ソフトウェア開発費用の大部分を繰り越しした。
|