研究課題/領域番号 |
21K18358
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分2:文学、言語学およびその関連分野
|
研究機関 | 東京工業大学 |
研究代表者 |
徳永 健伸 東京工業大学, 情報理工学院, 教授 (20197875)
|
研究分担者 |
山元 啓史 東京工業大学, リベラルアーツ研究教育院, 教授 (30241756)
横野 光 明星大学, 情報学部, 准教授 (60535863)
|
研究期間 (年度) |
2021-07-09 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
6,500千円 (直接経費: 5,000千円、間接経費: 1,500千円)
2023年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2022年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
2021年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | 対話システム / 語彙レベル / 語彙レベルアライメント / 言語学習 / 語彙テスト / 生産語彙 / 語彙能力指標 |
研究開始時の研究の概要 |
本研究は言語学習者の生産語彙能力をコンピュータとの対話を通して自動的に評定する手法を提案し,そのプロトタイプ・システムを実装して手法の有用性を実証することを目的とする.この目的を達成するために学習者がコンピュータとの対話をおこなう過程で自発的に発する発話を分析し,学習者の生産語彙能力を客観的に評価するシステムを実現する.そのための要素となる手法・技術は言語処理ならびに言語教育の学術的な観点からも重要であるが,同時に言語教育の現場においては,教師の負担を軽減するとともに,適切な評価によって学習者の学習効率を改善する効果が期待できる.
|
研究実績の概要 |
昨年度までの研究により,対話においては使用する表現が同調する語彙アライメントに加え,使用する語彙の難しさにもアライメントが生じることを発見した.我々はこれを語彙レベル・アライメント(Lexical Level Alignment; LLA)と呼び,最終年度は,LLAを定量的分析するとともに,大規模言語モデルを用いて対話システムにおけるLLAを実現する手法を提案した.LLAの定量的分析では,BTSJ日本語1000人自然会話コーパス(BTSJ-1000コーパス)を分析することによって,LLAが自然な対話で起こること,またLLAに影響を与える要因を分析した.その結果,LLAは,対話者の語彙レベルが異なり,相手が初対面であるなどして,相手の語彙レベルがわからない場合に顕著に生じることがわかった. LLAの実現については,発話生成にはプロンプトベースの大規模言語モデル(LLM)として有名なChatGPTを採用した.しかし,ChatGPTの語彙レベル知識を語彙レベル比較問題でテストしたところ,ChatGPTへのプロンプトだけでは,発話の語彙レベルを制御することは困難であることがわかった。そこで,指定された語彙レベルの単語候補リストを作成する外部モジュールを導入するとともに,一貫性のある対話を維持するために,現在の対話トピックを考慮した単語選択方式を提案した.LLAの分析に用いたのと同じ対話で提案手法を評価し,発話で使われる単語の語彙レベルを指定されたレベルに調整できることがわかった.この手法を使うことで意図的に対話システムの語彙レベルを制御し,言語学習者のLLAの程度によって語彙力を測定することが可能となる.
|