• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Annual Research Report

動画談話構造解析とそれを用いた要約生成

Research Project

Project/Area Number 21H03505
Research InstitutionNTT Communication Science Laboratories

Principal Investigator

平尾 努  日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 主任研究員 (40396148)

Co-Investigator(Kenkyū-buntansha) 木村 昭悟  日本電信電話株式会社NTTコミュニケーション科学基礎研究所, メディア情報研究部, 主幹研究員 (10396202)
奥村 学  東京工業大学, 科学技術創成研究院, 教授 (60214079)
Project Period (FY) 2021-04-01 – 2024-03-31
Keywords自然言語処理 / 談話構造解析 / キャプショニング
Outline of Annual Research Achievements

動画談話構造解析法の開発:動画談話構造解析技術を実現するにはモデルの訓練/評価のためのデータセットの整備が必須である.データセットは,動画に対するイベント分割とそのキャプショニング,つまりDense Video Captioning (DVC) の結果とそれに対する談話構造解析の結果が必要となる.令和3年度では,アノテーションの信頼性を議論するため,少量の動画に対し,2名の作業者のDVCの結果がどの程度一致するかを調べた.その結果,既存データセットであるActivityNet Captionsと比較して,イベント分割の一致,キャプションの一致とも高いことを確認した.そして,既存のテキスト談話構造解析モデルの訓練/評価用ベンチマークデータセットであるRST Discourse Treebank (RST-DT) のアノテーション指針に従い,DVCの結果に対し,木構造,核性,関係ラベルアノテーションを行い,動画談話構造解析用のアノテーションが可能かを調べた.その結果,木構造,核性に関してはRST-DTの指針に従うことが可能であったが,関係ラベルに関しては見直しが必要であることがわかった.そこで,動画談話構造解析用に関係ラベルを新たに定義したうえで,大規模データセットを構築した.また,DVCと同様に談話構造のアノテーションの信頼性を議論するため,2名の作業者間のアノテーションの結果の一致を調べた.その結果,RST-DT における作業者間の一致とほぼ同等であることを確認した.

また,テキストを対象としたニューラルモデルによる談話構造解析に関して,解析戦略(トップダウン,ボトムアップ)とテキストスパンのベクトル表現を得るための事前学習済み言語モデルの組み合わせが解析性能にどのような影響を与えるかを調べた結果,解析戦略の影響は小さく,事前学習済み言語モデルの影響が大きいことがわかった.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

動画談話構造解析モデルを訓練/評価するためのデータセットを予定通り作成でき,その信頼性が十分高いことも確認できた.また,テキスト談話構造解析の方向性についても知見を得ることができたので今年度については計画通り達成できたと考えている.

Strategy for Future Research Activity

今後も計画通り進めていく予定である.

  • Research Products

    (3 results)

All 2022 2021

All Presentation (3 results) (of which Int'l Joint Research: 2 results)

  • [Presentation] 言語モデルと解析戦略の観点からの修辞構造解析器の比較2022

    • Author(s)
      小林尚輝, 平尾努, 上垣外英剛, 奥村学, 永田昌明
    • Organizer
      言語処理学会第28回年次大会
  • [Presentation] Improving Neural RST Parsing Model with Silver Agreement Subtrees2021

    • Author(s)
      Naoki Kobayashi, Tsutomu Hirao, Hidetaka Kamigaito, Manabu Okumura, Masaaki Nagata
    • Organizer
      Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies
    • Int'l Joint Research
  • [Presentation] A Language Model-based Generative Classifier for Sentence-level Discourse Parsing2021

    • Author(s)
      Ying Zhang, Hidetaka Kamigaito, Manabu Okumura
    • Organizer
      Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing
    • Int'l Joint Research

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi