2023 Fiscal Year Annual Research Report

コンピュータとの対話による言語学習者の生産語彙能力評定の自動化

Research Project

Project/Area Number	21K18358
Research Institution	Tokyo Institute of Technology
Principal Investigator	徳永健伸東京工業大学, 情報理工学院, 教授 (20197875)
Co-Investigator(Kenkyū-buntansha)	山元啓史東京工業大学, リベラルアーツ研究教育院, 教授 (30241756) 横野光明星大学, 情報学部, 准教授 (60535863)
Project Period (FY)	2021-07-09 – 2024-03-31
Keywords	対話システム / 語彙レベル / 語彙レベルアライメント / 言語学習
Outline of Annual Research Achievements	昨年度までの研究により，対話においては使用する表現が同調する語彙アライメントに加え，使用する語彙の難しさにもアライメントが生じることを発見した．我々はこれを語彙レベル・アライメント(Lexical Level Alignment; LLA)と呼び，最終年度は，LLAを定量的分析するとともに，大規模言語モデルを用いて対話システムにおけるLLAを実現する手法を提案した．LLAの定量的分析では，BTSJ日本語1000人自然会話コーパス(BTSJ-1000コーパス)を分析することによって，LLAが自然な対話で起こること，またLLAに影響を与える要因を分析した．その結果，LLAは，対話者の語彙レベルが異なり，相手が初対面であるなどして，相手の語彙レベルがわからない場合に顕著に生じることがわかった． LLAの実現については，発話生成にはプロンプトベースの大規模言語モデル（LLM）として有名なChatGPTを採用した．しかし，ChatGPTの語彙レベル知識を語彙レベル比較問題でテストしたところ，ChatGPTへのプロンプトだけでは，発話の語彙レベルを制御することは困難であることがわかった。そこで，指定された語彙レベルの単語候補リストを作成する外部モジュールを導入するとともに，一貫性のある対話を維持するために，現在の対話トピックを考慮した単語選択方式を提案した．LLAの分析に用いたのと同じ対話で提案手法を評価し，発話で使われる単語の語彙レベルを指定されたレベルに調整できることがわかった．この手法を使うことで意図的に対話システムの語彙レベルを制御し，言語学習者のLLAの程度によって語彙力を測定することが可能となる．

Research Products
(2 results)

All Presentation (2 results) (of which Int'l Joint Research: 1 results)

[Presentation] 大規模言語モデルを用いた対話システムの語彙レベル制御2024
- Author(s)
  YiKai Tseng，徳永健伸，横野光
- Organizer
  言語処理学会第30回年次大会(NLP2024)
[Presentation] Lexical level alignment in dialogue2023
- Author(s)
  Yi Kai Tseng, Takenobu Tokunaga and Hikaru Yokono
- Organizer
  The 27th Workshop on the Semantics and Pragmatics of Dialogue (MariLogue)
- Int'l Joint Research