• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Research-status Report

自然言語文生成における内容的多様性の改善

Research Project

Project/Area Number 22K17943
Research InstitutionTohoku University

Principal Investigator

赤間 怜奈  東北大学, データ駆動科学・AI教育研究センター, 助教 (70912533)

Project Period (FY) 2022-04-01 – 2025-03-31
Keywords自然言語処理 / 深層学習 / ニューラルネットワーク / 人工知能
Outline of Annual Research Achievements

本研究は、深層学習型文生成技術が抱える内容的多様性の欠如を解決すべき課題として切り出し、現在の文生成モデルが既に有している理想的な表層的多様性を維持しつつ、欠点である内容的多様性の改善に取り組むものである。これを達成するために、具体的には、深層学習型生成モデルの内部で内容的多様性の欠落が生じるメカニズムの解明と、そこで得られた知見に基づき生成時に内容的多様性を保持する仕組みの確立を目指す。
1年目にあたる本年度は、表層的多様性および内容的多様性に焦点を当てたモデル横断的な性能調査・分析に関する研究に着手した。目的は、モデル毎の生成能力や同定能力の上限を正確に把握することと、内容的多様性の扱いに適正のある構造に対して知見を得ることにある。初手として、既存の文生成タスクの中でも、内容的多様性がタスク要件における特に重要な要素となる対話応答生成タスクを題材とした。最近の高性能対話応答生成モデルを対象に、モデル構造と照らし合わせて多様性に関するモデルの振る舞いを調査することに加え(成果は複数の国際会議で発表)、より精緻な分析を可能にする新しい言語資源の開発にも取り組んだ。新たに開発した分析用対話コーパスは、基本語彙と基本語順を使用した規範的な言語表現で書かれた高品質な対話を収録したものである。既存資源と同等または上回る語彙的多様性、親密性、可読性をバランスよく兼ね備えており、構築方法の工夫によってノイズ等もほとんど含まないため計算機上での処理もしやすい。成果は、自然言語処理分野の国内最大の学会である言語処理学会で発表した。本資源の学術的価値は分野で高く評価され、言語資源賞を授与された。
今後は、今回構築したコーパスも利用しながら引き続きモデル横断的な分析を進めるとともに、分析結果をもとに、深層学習型生成モデルで内容的多様性の欠落が生じるメカニズムの数理的解明にも着手していく。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

当初の計画どおり、まずは、表層的多様性および内容的多様性に焦点を当てたモデル横断的な性能調査・分析に関する研究に着手した。内容的多様性がタスク要件における特に重要な要素となる対話応答生成タスクを題材に、既存の対話応答生成モデルの振る舞いを調査した。生成モデルの多様性を構成する諸要素にそれぞれ着目した詳細な分析をおこない、最近の深層学習型生成モデルについてモデル構造と生成の傾向についての知見を収集することができた。その過程で、本研究課題の遂行には、既存のデータセットに加えて新たな分析用データセットの需要も判明したため、当初の計画にこそ含まれていないが、必要なデータセットの開発も並行しておこなった。予定していたモデル横断的な性能調査・分析に加え、分析用資源の開発も実現できたという点で、本研究加害は、現時点では当初の計画以上に進展しているといえる。

Strategy for Future Research Activity

基本的には当初の計画通りに研究を推進していく予定である。現時点では、研究計画の変更や見直し等は特には必要性ないと考える。モデル横断的な性能調査・分析については、新たに公開される最新モデルも調査・分析対象に適宜含めつつ、今回新たに構築したコーパスも利用しながらより精緻な分析を進めていく。分析結果をもとに、深層学習型生成モデルで内容的多様性の欠落が生じるメカニズムの解明にも本格的に着手していく予定である。

Causes of Carryover

マシンスペックと納入期限の都合で、ローカル開発用計算機の購入を次年度へ持ち越しとした。状況が整い次第、次年度使用額を用いて購入する予定である。

  • Research Products

    (10 results)

All 2023 2022

All Journal Article (3 results) (of which Peer Reviewed: 3 results,  Open Access: 3 results) Presentation (7 results) (of which Int'l Joint Research: 3 results,  Invited: 1 results)

  • [Journal Article] Bipartite-play Dialogue Collection for Versatile and Practical Automatic Dialogues Evaluation2022

    • Author(s)
      Shiki Sato, Yosuke Kishinami, Hiroaki Sugiyama, Reina Akama, Ryoko Tokuhisa and Jun Suzuki
    • Journal Title

      Proceedings of the 2nd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 12th International Joint Conference on Natural Language Processing: SRW

      Volume: - Pages: 8-16

    • Peer Reviewed / Open Access
  • [Journal Article] Target-Guided Open-Domain Conversation Planning2022

    • Author(s)
      Yosuke Kishinami, Reina Akama, Shiki Sato, Ryoko Tokuhisa, Jun Suzuki and Kentaro Inui
    • Journal Title

      Proceedings of the 29th International Conference on Computational Linguistics

      Volume: - Pages: 660-668

    • Peer Reviewed / Open Access
  • [Journal Article] N-best Response-based Analysis of Contradiction-awareness in Neural Response Generation Models2022

    • Author(s)
      Shiki Sato, Reina Akama, Hiroki Ouchi, Ryoko Tokuhisa, Jun Suzuki and Kentaro Inui
    • Journal Title

      Proceedings of the 23rd Annual Meeting of the Special Interest Group on Discourse and Dialogue

      Volume: - Pages: 637-644

    • Peer Reviewed / Open Access
  • [Presentation] 人間同士の雑談における話題遷移モデリング2023

    • Author(s)
      岸波 洋介, 赤間 怜奈, 佐藤 志貴, 徳久 良子, 鈴木 潤, 乾 健太郎
    • Organizer
      言語処理学会第29回年次大会
  • [Presentation] Follow-up質問による矛盾応答収集の提案2023

    • Author(s)
      佐藤 志貴, 赤間 怜奈, 鈴木 潤, 乾 健太郎
    • Organizer
      言語処理学会第29回年次大会
  • [Presentation] 日本語日常対話コーパスの構築2023

    • Author(s)
      赤間 怜奈, 磯部 順子, 鈴木 潤, 乾 健太郎
    • Organizer
      言語処理学会第29回年次大会
  • [Presentation] Bipartite-play Dialogue Collection for Versatile and Practical Automatic Dialogues Evaluation2022

    • Author(s)
      Shiki Sato, Yosuke Kishinami, Hiroaki Sugiyama, Reina Akama, Ryoko Tokuhisa and Jun Suzuki
    • Organizer
      the 2nd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 12th International Joint Conference on Natural Language Processing SRW
    • Int'l Joint Research
  • [Presentation] Target-Guided Open-Domain Conversation Planning2022

    • Author(s)
      Yosuke Kishinami, Reina Akama, Shiki Sato, Ryoko Tokuhisa, Jun Suzuki and Kentaro Inui
    • Organizer
      the 29th International Conference on Computational Linguistics
    • Int'l Joint Research
  • [Presentation] N-best Response-based Analysis of Contradiction-awareness in Neural Response Generation Models2022

    • Author(s)
      Shiki Sato, Reina Akama, Hiroki Ouchi, Ryoko Tokuhisa, Jun Suzuki and Kentaro Inui
    • Organizer
      the 23rd Annual Meeting of the Special Interest Group on Discourse and Dialogue
    • Int'l Joint Research
  • [Presentation] 日本語日常対話コーパスの構築と自然言語処理への活用2022

    • Author(s)
      赤間 怜奈
    • Organizer
      Evidence-based Linguistics Workshop 2022 「日本語における評価用データセットの構築と利用性の向上」分科会
    • Invited

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi