研究課題/領域番号 |
16K00489
|
研究機関 | 津田塾大学 |
研究代表者 |
来住 伸子 津田塾大学, 学芸学部, 教授 (50245990)
|
研究分担者 |
岸 康人 松蔭大学, 観光メディア文化学部, 教授 (50552999)
田近 裕子 津田塾大学, 総合政策学部, 教授 (80188268)
久島 智津子 津田塾大学, 言語文化研究所, 研究員 (80623876)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
キーワード | 英語学習 / 教材作成 / 文書類似度 / 文書分類 / 潜在意味解析 |
研究実績の概要 |
この研究では、潜在意味解析(Latent Semantic Analysis)、語頻度、語頻度・逆文書頻度(tf-idf)の3種類の文書類似度評価方法を利用して、英語学習者の興味や習熟度に適した用例を自動生成することを目指している。先行研究では、潜在意味解析が、専門用語の多い英語表現の分類に利用できることを確認されていう。 この研究では、実際の英語教育に実用的に利用できる英文用例の自動生成をめざして、対象とする文書集合の大規模化と、文書や用例の難易度の自動分類に取り組んでいる。とくに、潜在意味解析による文書類似度評価の高速化と、学習者の習熟度にあわせた用例の自動生成に取り組んでいる。平成29年度は、高速化計画の一環として、サーバーを購入し整備した。サーバー整備の一環として、機種や構成の選定作業を行った。 平成30年度は、学習者の習熟度に合わせた難易度分類についての先行研究のサーベイを行なった。文書類似度を内容にもとづく文書分類だけでなく、難易度分類にも利用する方法を検討した。また、文書類似度計算の高速化のために、言語処理系や、各種ライブラリの性能評価を継続して行った。 本来は、平成30年度は計画最終年度であるため、文書類似度に基づく英文用例の自動生成を実装し、実際の学習者で評価する予定であった。しかし、進捗状況欄で説明する理由により、実装や評価に至らなかった。また、学習者の習熟度と、用例の難易度の対応付けなど、解決が難しい問題もわかってきた。研究計画の延長を申請した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
平成30年度は、日本で国際情報オリンピック日本大会(IOI2018)が開催された。その開催団体の国際情報オリンピック日本委員会の関係者としてIOI2018 運営に半年間関わざるを得ず、研究時間が十分にとれなかった。本務校に戻れた、残りの半年間も、大学業務が集中したので、研究時間が十分にとれなかった。
|
今後の研究の推進方策 |
研究期間の延長が認められたので、当初の申請内容を実施できるよう、十分な研究時間を確保することに最大限の注意を払う。
|
次年度使用額が生じた理由 |
当該年度に、文書類似度にもとづく英文用例生成システムを実装する予定であったが、実装を延期した。2019年度に当初予定していた実装を行なう。
|