2023 Fiscal Year Annual Research Report
コンピュータとの対話による言語学習者の生産語彙能力評定の自動化
Project/Area Number |
21K18358
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
徳永 健伸 東京工業大学, 情報理工学院, 教授 (20197875)
|
Co-Investigator(Kenkyū-buntansha) |
山元 啓史 東京工業大学, リベラルアーツ研究教育院, 教授 (30241756)
横野 光 明星大学, 情報学部, 准教授 (60535863)
|
Project Period (FY) |
2021-07-09 – 2024-03-31
|
Keywords | 対話システム / 語彙レベル / 語彙レベルアライメント / 言語学習 |
Outline of Annual Research Achievements |
昨年度までの研究により,対話においては使用する表現が同調する語彙アライメントに加え,使用する語彙の難しさにもアライメントが生じることを発見した.我々はこれを語彙レベル・アライメント(Lexical Level Alignment; LLA)と呼び,最終年度は,LLAを定量的分析するとともに,大規模言語モデルを用いて対話システムにおけるLLAを実現する手法を提案した.LLAの定量的分析では,BTSJ日本語1000人自然会話コーパス(BTSJ-1000コーパス)を分析することによって,LLAが自然な対話で起こること,またLLAに影響を与える要因を分析した.その結果,LLAは,対話者の語彙レベルが異なり,相手が初対面であるなどして,相手の語彙レベルがわからない場合に顕著に生じることがわかった. LLAの実現については,発話生成にはプロンプトベースの大規模言語モデル(LLM)として有名なChatGPTを採用した.しかし,ChatGPTの語彙レベル知識を語彙レベル比較問題でテストしたところ,ChatGPTへのプロンプトだけでは,発話の語彙レベルを制御することは困難であることがわかった。そこで,指定された語彙レベルの単語候補リストを作成する外部モジュールを導入するとともに,一貫性のある対話を維持するために,現在の対話トピックを考慮した単語選択方式を提案した.LLAの分析に用いたのと同じ対話で提案手法を評価し,発話で使われる単語の語彙レベルを指定されたレベルに調整できることがわかった.この手法を使うことで意図的に対話システムの語彙レベルを制御し,言語学習者のLLAの程度によって語彙力を測定することが可能となる.
|