2020 Fiscal Year Research-status Report
潜在意味解析モデルを用いた語彙学習の予測と妥当性の検証:多量のインプットの役割
Project/Area Number |
18K00748
|
Research Institution | Prefectural University of Kumamoto |
Principal Investigator |
吉井 誠 熊本県立大学, 文学部, 教授 (70240231)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | 潜在意味解析 / 第二言語習得 / 語彙習得 / 多読 / シミュレーション |
Outline of Annual Research Achievements |
本研究では多量のインプットを受ける中でどれくらいの語彙知識を増やしていけるのか、潜在意味解析(英語でLSA:Latent Semantic Analysis)という手法を通して予測を立てること、そしてその予測の妥当性を検証することを目的とした。2020年度には2本の論文を執筆し、これまでの成果をまとめてきた。吉井(2020)では日本人大学生の語彙知識と英語母語話者の語彙知識とを比較することにこの手法を用いられないか検討した。日本人大学生は実際に語彙サイズテストを受験してもらった。英語母語話者に実際にテストを受験してもらうことは困難であった。その代わりにLSAで語彙サイズを推定した。母語話者の語彙力を反映するコーパスを用い、LSAを用いて語彙サイズテストに解答した。LSAでは実際の受験者の語彙サイズを過小評価する傾向はあるものの、ある適度語彙サイズを推定することは可能であることを示した。また、吉井(2021)では、実際の英語母語話者が語彙サイズテストを受けたデータを入手し、そのデータと、LSAで推定される語彙サイズテストとを比較した。結果はLSAの推定値は実際の学習者の回答の傾向を示しながらもサイズを過小評価することを再認する形となった。このようにここまでの研究を通してLSAの可能性と共に、その限界・課題についても示唆される結果となった。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
上記の実績の所で記したように、ここまでの成果を論文としてまとめることができた。その中で潜在意味解析の可能性を確認するとともに、その限界(潜在意味解析の結果が実際の学習者のデータを過小評価する傾向があること)についても示された。潜在意味解析を基にしたシミュレーションや語彙習得過程のモデル化に至っていない点では、描いていた計画からは遅れているが、それ以前に、克服すべき課題が明らかになったことは評価でき、また、幸い研究実施期間の延長が認められたこともあり、その点ではおおむね順調と言える。
|
Strategy for Future Research Activity |
2020年度は潜在意味解析の語彙サイズ推定における過小評価の問題に遭遇した。この問題がどこから来るのか、そしてこの問題を克服するにはどうしたらよいのかを探っていく。語彙サイズテストのみならず、既存のデータで活用可能なものを探し、また、潜在意味解析を行うのに適切なコーパスを探し直すことから始め、この手法の過小評価の現象を捉えなおし、その原因について探求する予定である。
|
Causes of Carryover |
上記の潜在意味解析の過小評価の問題について、国内外の研究者との意見交換をすることを目的に、国内外の学会での発表や意見交換の機会を探ったが、それを行うのに適切と思われる学会がキャンセル、延期される事が続いた。昨年度から、オンライン開催へと踏み切った学会が増えてきたこともあり、オンラインでの意見交換の場を探していく予定である。また、このコロナの状況が改善された折には、海外、特に英国の語彙習得の研究者と直に会って意見交換する機会を探す予定である。
|