2020 Fiscal Year Research-status Report
機械翻訳活用のための前編集手法の体系化と段階的編集支援ツールの開発
Project/Area Number |
19K20628
|
Research Institution | Nagoya University |
Principal Investigator |
宮田 玲 名古屋大学, 工学研究科, 助教 (70804300)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 前編集(プリエディット) / 書き換え方略 / 機械翻訳応用 / 翻訳品質評価 / 編集支援システム |
Outline of Annual Research Achievements |
2020年度(第2年度)は、(1)機械翻訳向け前編集ルールの構築に向けた前編集事例の分析、および(2)前編集ルールを効率的に適用するためのツールのプロトタイプの開発を行った。 (1) 機械翻訳向け前編集事例の分析 原文の内容を維持したまま、十分な品質の機械翻訳結果が得られるまで原文の書き換えを繰り返すという探索的な手法を用いて、2019年度(第1年度)に6652件の人手書き換え事例を収集した。2020年度は、このデータを対象に、(a)書き換え後の「機械翻訳しやすい」原文の特徴、(b)原文書き換え操作の多様性、(c)各書き換えが機械翻訳に与える影響の観点から分析を行った。(b)の分析においては、6カテゴリ39タイプの言語学的な書き換え方法を整理するだけでなく、明示化・暗示化・情報保持の情報方略の観点から、事例を分析した。特に翻訳品質の向上に寄与すると考えられる明示化方略について、情報の追加、関係の明示、意味の限定、正規化の4つのサブタイプを同定した。近年のニューラル機械翻訳に対しては、1文を短くすることよりも、文の内容や構造を明示化することが有効であることが示唆された。 (2)書き換え支援ツールの開発 日本語表現の書き換えを支援するツールのプロトタイプを実装し、一部のルールを実装した。本ツールは、書き換え表現検出、書き換え候補生成、候補ランキングを段階的に行う。また、人手による言語変換ルールの定義が難しい日本語文末述語の書き換えについて、機械学習手法の実装と評価を行った。マスク言語モデルを用いて、複数語からなる書き換え対象表現をまとめて書き換える手法を提案・実装し、人手評価により従来手法を大きく上回る性能を確認した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究計画調書において2020年度は、書き換えルールの作成・評価および書き換えツールの一部実装を予定していた。この内、書き換えルールのベースとなる表現の整理はほぼ完了しており、ルール化も進んでいる。まだルール化されていないものについても今後の研究方針は概ね決まっている。また、データ構築の段階で、翻訳品質の評価結果が得られている。原文品質の評価も、一部については完了しており、今後の見通しは立っている。さらに、2020~2021年度で予定していた書き換えツールについては、基盤となるシステムの設計が完了し、インタフェースの開発も進んでいる。
|
Strategy for Future Research Activity |
今後は主に以下の研究を行う。 ・書き換えルールのツール化と性能評価:2020年度に構築したプロトタイプをベースに、引き続き、書き換え表現検出、書き換え候補生成、候補ランキングを段階的に実装し、ツールとして提供する。また、各段階の性能評価を行い、ツールの改良を行う。 ・ユーザによる書き換え評価実験:ユーザは作成した書き換えルールを適切に使いこなせるか、また段階的書き換えツールはユーザにとって有用であるかを書き換え実験により検証する。具体的には、文章をルールに従って書き換える作業を設計し、実験協力者をツールの使用あり/なしの2 群に分け、ユーザビリティの3基準である効果(書き換え達成度・文章品質)、効率(書き換え作業時間)、満足度(タスクおよびツールに対する主観判定)の観点から評価を行う。
|
Research Products
(6 results)