2022 年度実績報告書

テーマ型対話における対話マネジメントの方法論解明およびマネジメントシステムの構築

研究課題

研究課題/領域番号	20J21694
研究機関	東北大学
研究代表者	阿部香央莉東北大学, 情報科学研究科, 特別研究員(DC1)
研究期間 (年度)	2020-04-24 – 2023-03-31
キーワード	機械翻訳 / 実応用 / 評価指標 / ベンチマーク
研究実績の概要	R4年度では、これまでの業績と残された研究期間を考慮し、「機械翻訳の実応用利用」を主軸に研究を進めることとした。具体的には、昨年度から始めた、2文間の意味的類似度を予測するSemantic Textual Similarity（STS）ベンチマークタスクのデータセットによる評価分析を進めた。我々はSTSでの評価とその応用タスク（”機械翻訳”評価タスク等）での評価結果間の相違を示し、STS上の評価でモデルの性能を競い合っている現状に対し警鐘を鳴らした。この評価の相違を引き起こす要因を検証し、データドメイン（新聞記事・質問応答文等）の違い・タスク設計（与えられる2文間の類似度の前提）の違い・タスクにおける類似度定義（時制・固有名詞など何の違いを重要視するか）の違いが評価の相違を引き起こすことを突き止めた。本研究の結果は、自然言語処理における評価に着目したワークショップEval4NLPに採択された。また、昨年同様、機械翻訳の実応用時の課題の一つである、与えられた用語リストに従って翻訳する制約付き翻訳シェアードタスクの運営を務めた。前年度に人手で構築した日英データに加え、本年度ではデータセット構築の効率化を目指し、既存の用語抽出ツールを用いて日中データを半自動で作成した。また、シェアードタスクにおいて提出されたシステム出力に対する自動・人手評価結果の分析を行い、①本年度で提出された学習データの工夫と自動後編集手法を組み合わせた手法が、用語を強制出力させる代わり処理速度が遅い既存の最高性能手法に対し処理速度を改善しつつ匹敵する性能を持つこと、および②正誤判定が難しい専門用語の影響により、タスクの評価における判断が妥当でない例が含まれており、より頑健な評価を追求する必要があることを突き止めた。本研究の結果は、アジア圏機械翻訳ワークショップWATおよび博士論文に記載されている。
現在までの達成度 (段落)	令和4年度が最終年度であるため、記入しない。
今後の研究の推進方策	令和4年度が最終年度であるため、記入しない。
備考	(1) WAT2021-2022にて開催したシェアードタスクのホームページ。

研究成果
(7件)

すべて 2022 その他

すべて学会発表 (6件) (うち国際学会 4件、招待講演 1件) 備考 (1件)

[学会発表] 文間意味的類似度のベンチマークタスクと実応用タスクの乖離2022
- 著者名/発表者名
  阿部香央莉、横井祥、梶原智之、乾健太郎
- 学会等名
  2022年度人工知能学会全国大会 (JSAI2022)
[学会発表] Why is sentence similarity benchmark not predictive of application-oriented task performance?2022
- 著者名/発表者名
  Kaori Abe, Sho Yokoi, Tomoyuki Kajiwara, Kentaro Inui
- 学会等名
  The 3rd Workshop on Evaluation & Comparison of NLP Systems (Eval4NLP2022)
- 国際学会
[学会発表] Chat Translation Error Detection for Assisting Cross-lingual Communications2022
- 著者名/発表者名
  Yunmeng Li, Jun Suzuki, Makoto Morishita, Kaori Abe, Ryoko Tokuhisa, Ana Brassard, Kentaro Inui
- 学会等名
  The 3rd Workshop on Evaluation & Comparison of NLP Systems (Eval4NLP2022)
- 国際学会
[学会発表] Topicalization in Language Models A Case Study on Japanese2022
- 著者名/発表者名
  Riki Fujihara, Tatsuki Kuribayashi, Kaori Abe and Kentaro Inui
- 学会等名
  The 29th International Conference on Computational Linguistics (COLING2022)
- 国際学会
[学会発表] 日本語を含む言語対における制約付き翻訳タスクの近況2022
- 著者名/発表者名
  阿部香央莉
- 学会等名
  AAMT 2022, Tokyo ～機械翻訳最前線～
- 招待講演
[学会発表] Overview of the 9th Workshop on Asian Translation2022
- 著者名/発表者名
  Toshiaki Nakazawa, Hideya Mino, Isao Goto, Raj Dabre, Shohei Higashiyama, Shantipriya Parida, Anoop Kunchukuttan, Makoto Morishita, Ondrej Bojar, Chenhui Chu, Akiko Eriguchi, Kaori Abe, Yusuke Oda, and Sadao Kurohashi
- 学会等名
  The 9th Workshop on Asian Translation (WAT2022)
- 国際学会
[備考] Restricted Translation Task
- URL
  https://sites.google.com/view/restricted-translation-task/

2022 年度 実績報告書

テーマ型対話における対話マネジメントの方法論解明およびマネジメントシステムの構築

研究代表者

阿部 香央莉 東北大学, 情報科学研究科, 特別研究員(DC1)

研究成果

[学会発表] 文間意味的類似度のベンチマークタスクと実応用タスクの乖離2022

著者名/発表者名

学会等名

[学会発表] Why is sentence similarity benchmark not predictive of application-oriented task performance?2022

著者名/発表者名

学会等名

[学会発表] Chat Translation Error Detection for Assisting Cross-lingual Communications2022

著者名/発表者名

学会等名

[学会発表] Topicalization in Language Models A Case Study on Japanese2022

著者名/発表者名

学会等名

[学会発表] 日本語を含む言語対における制約付き翻訳タスクの近況2022

著者名/発表者名

学会等名

[学会発表] Overview of the 9th Workshop on Asian Translation2022

著者名/発表者名

学会等名

[備考] Restricted Translation Task

URL

2022 年度実績報告書

阿部香央莉東北大学, 情報科学研究科, 特別研究員(DC1)