• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2017 Fiscal Year Annual Research Report

ナゲットに基づくタスク指向対話の自動評価に関する研究

Research Project

Project/Area Number 17H01830
Research InstitutionWaseda University

Principal Investigator

酒井 哲也  早稲田大学, 理工学術院, 教授 (80723519)

Project Period (FY) 2017-04-01 – 2021-03-31
Keywords対話 / 評価 / 自然言語 / 情報アクセス
Outline of Annual Research Achievements

ヘルプデスク対話データセットversion 0の公開 (http://waseda.box.com/DCH-0-1) と、NTCIR-14 Short Text Conversation Task (STC-3) (http://sakailab.com/ntcir14stc3/) の対話サブタスクの設計および評価指標の検討を行い、以下の学会発表を行った。
・Zeng, Z. et al.: Test Collections and Measures for Evaluating Customer-Helpdesk Dialogues, EVIA 2017, pp.1-9, 査読あり, 2017.
概要: We address the problem of evaluating textual, task-oriented dialogues between the customer and the helpdesk, such as those that take the form of online chats. As an initial step towards evaluating automatic helpdesk dialogue systems, we have constructed a test collection comprising 3,700 real Customer-Helpdesk multiturn dialogues by mining Weibo, a major Chinese social media. We have made our test collection DCH-1 publicly available for research purposes.
・Sakai, T: Towards Automatic Evaluation of Multi-Turn Dialogues: A Task Design that Leverages Inherently Subjective Annotations, EVIA 2017, pp.24-30, 査読あり, 2017.概要: This paper proposes a design of a shared task whose ultimate goal is automatic evaluation of multi-turn, dyadic, textual helpdesk dialogues. The proposed task takes the form of an offline evaluation, where participating systems are given a dialogue as input, and output at least one of the following: (1) an estimated distribution of the annotators’ quality ratings for that dialogue; and (2) an estimated distribution of the annotators’ nugget type labels for each utterance block (i.e., a maximal sequence of consecutive posts by the same utterer) in that dialogue.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

当初の予定通り、以下2点を達成することができた。
(1)評価型国際会議NTCIR (NII Testbeds and Community for Information access Research) において、提案する対話タスクがNTCIR-14 Short Text Conversation Task 3 (STC-3) として採択された。(当初の計画ではDialogue Taskと呼んでいたが、NTCIR-13最大の参加者を誇ったSTC-2の後継という位置づけで提案を行ったためこのような名称となった。)
(2)ヘルプデスク対話データセットDCH-1 を、その34%を中国語から英語に人手で翻訳したデータも含め、一般公開することができた。

Strategy for Future Research Activity

2018年度の計画は以下の通りである。
4月 中国語テストデータの作成、アノテーションツールの開発; 5-6月 テストデータおよび訓練データ一部の中英翻訳; 5-8月 中国語テストデータ・訓練データのアノテーション; 9/1 アノテーションつき訓練データ公開; 11/1 タスク参加者にテストデータ公開; 11/30 参加システム結果提出締切; 2/1 評価結果・タスクオーガナイザ論文(ドラフト)公開; 2/E 作成したデータセットについてリソース論文をSIGIR 2019に投稿; 3/15 参加者論文締切; 3/E 結果まとめ

  • Research Products

    (5 results)

All 2017 Other

All Int'l Joint Research (1 results) Presentation (2 results) (of which Int'l Joint Research: 2 results) Remarks (2 results)

  • [Int'l Joint Research] 清華大学/華為技術/今日頭條(中国)

    • Country Name
      CHINA
    • Counterpart Institution
      清華大学/華為技術/今日頭條
  • [Presentation] Test Collections and Measures for Evaluating Customer-Helpdesk Dialogues2017

    • Author(s)
      Zeng, Z., Luo, C., Shang, L., Li, H., and Sakai, T.
    • Organizer
      The 8th International Workshop on Evaluating Information Access (EVIA 2017)
    • Int'l Joint Research
  • [Presentation] Towards Automatic Evaluation of Multi-Turn Dialogues: A Task Design that Leverages Inherently Subjective Annotations2017

    • Author(s)
      Sakai, T.
    • Organizer
      The 8th International Workshop on Evaluating Information Access (EVIA 2017)
    • Int'l Joint Research
  • [Remarks] ヘルプデスク対話データセットDCH-1 (中国語、一部英訳あり)

    • URL

      http://waseda.box.com/DCH-0-1

  • [Remarks] NTCIR-14 Short Text Conversation 3 タスク ホームページ

    • URL

      http://sakailab.com/ntcir14stc3/

URL: 

Published: 2018-12-17  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi