2021 年度実績報告書

英語講義音声の音声翻訳と音声要約に基づく日本語字幕付き教材の自動生成に関する研究

研究課題

研究課題/領域番号	18H01062
研究機関	中部大学
研究代表者	中川聖一中部大学, 工学部, 客員教授 (20115893)
研究分担者	秋葉友良豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (00356346) 山本一公中部大学, 工学部, 教授 (40324230)
研究期間 (年度)	2018-04-01 – 2022-03-31
キーワード	英語の音声認識 / 英日音声翻訳 / 音声要約 / 英日機械翻訳 / 講義音声・講演音声 / 字幕 / TED Talks
研究実績の概要	本研究の要素研究である英語講演・講義の音声認識、日本語への翻訳、要約、およびこれらを統合した音声翻訳と音声要約の評価実験を行った。英語講演・講義の対象としてTED Talksを使用した。音声認識に関しては、本研究の開始当時と比べて深層ネットワーク技術の進展が著しく、Kaldiのツールキットを使用した。これをTED Talksの音声データと読み上げ音声であるLibriSpeechの大規模音声データを使用して音声認識モデルを学習した。これにより、平均88％の単語単位の音声認識精度を得た。音声翻訳に関しては、研究開始当時と比べてTransformerの発明により著しく性能が改善されたので、本研究もこれに基づき、英日・日英翻訳の双方向モデルを構築した。さらに、英語および日本語の単言語コーパスの翻訳に基づいて疑似的対訳コーパスによる対訳学習データの拡張、大規模対訳書き言葉コーパスによる初期モデルの作成（転移学習）などの改善により、約15のBleu値を得た。またヒト同士の翻訳結果のBleu値でも20前後であり、ヒトによる翻訳の揺れが大きいことも分かった。我々の翻訳結果の人手による評価は「まずまず内容が理解でき、意図が伝わる。一部に誤訳がある」という結果が得られた。音声要約に関しては、従来のMMR法にBERT法を組み込む方法を開発し、少ない学習データで従来よりも高い性能が得られた。最近の技術進展が著しいニューラルネットワークによる抽出型要約の代表的手法であるBertSumExt法も採用し、この方法で大規模書き言葉コーパスで学習したモデルに少量のTED講演コーパスで適応学習することにより、より高い要約性能を得た。音声翻訳と音声要約に関しては、単語認識精度が90%程度であれば、翻訳性能のBLEU値と要約性能のROUGEが、テキスト入力と比べて10%程度の低下にとどまることが分かった。
現在までの達成度 (段落)	令和3年度が最終年度であるため、記入しない。
今後の研究の推進方策	令和3年度が最終年度であるため、記入しない。

研究成果

(9件)

すべて 2023 2022

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (8件) (うち国際学会 2件)

[雑誌論文] ニューラル機械翻訳の反復的逆翻訳に基づくデータ拡張のための混成サンプリング法2023
- 著者名/発表者名
  森田智熙、秋葉友良、塚田元
- 雑誌名
  
  電子情報通信学会論文誌
  
  巻: 106-D, No.4 ページ: 298, 306
- DOI
  10.14923/transinfj.2022PDP0005
- 査読あり
[学会発表] TED講演の英日翻訳と日英翻訳の検討2023
- 著者名/発表者名
  足立十一郎、山本一公、中川聖一
- 学会等名
  言語処理学会、第29回年次大会
[学会発表] TED英語講演の音声認識・音声翻訳・音声要約の検討2023
- 著者名/発表者名
  坂野晴彦、桜井陽生、足立十一郎、山本一公、中川聖一
- 学会等名
  言語処理学会、第29回年次大会
[学会発表] ニューラル機械翻訳におけるIterative back-translationを利用したコンパラブルコーパスの活用2023
- 著者名/発表者名
  山本優紀、秋葉友良、塚田元
- 学会等名
  言語処理学会、第29回年次大会
[学会発表] 双方向翻訳モデルの相互学習による対訳語彙の教師なし獲得過程の調査2023
- 著者名/発表者名
  谷川琢磨、秋葉友良、塚田元
- 学会等名
  言語処理学会、第29回年次大会
[学会発表] 中間言語を介した２つの対訳コーパスを用いた対訳文のない言語対のNMTの検討2023
- 著者名/発表者名
  B. T. Thanh、秋葉友良、塚田元
- 学会等名
  言語処理学会、第29回年次大会
[学会発表] 答弁の種類に着目した抽象型要約に基づく議会会議録質問応答2023
- 著者名/発表者名
  河合輝也、秋葉友良
- 学会等名
  言語処理学会、第29回年次大会
[学会発表] Summarization of spoken lectures based on MMR method and important/unimportant sentence using BERT2022
- 著者名/発表者名
  K. Masuda, Y. Hayakawa, K. Yamamoto, S. Nakagawa
- 学会等名
  Proc. Global Conference on Consumer Electronics
- 国際学会
[学会発表] Semi-supervised ASR based on iterative joint training with discrete speech synthesis2022
- 著者名/発表者名
  K. Takagi, T. Akiba, H. Tsukada
- 学会等名
  Proc. APSIPA
- 国際学会

2021 年度 実績報告書

英語講義音声の音声翻訳と音声要約に基づく日本語字幕付き教材の自動生成に関する研究

研究代表者

中川 聖一 中部大学, 工学部, 客員教授 (20115893)

研究成果

[雑誌論文] ニューラル機械翻訳の反復的逆翻訳に基づくデータ拡張のための混成サンプリング法2023

著者名/発表者名

雑誌名

DOI

[学会発表] TED講演の英日翻訳と日英翻訳の検討2023

著者名/発表者名

学会等名

[学会発表] TED英語講演の音声認識・音声翻訳・音声要約の検討2023

著者名/発表者名

学会等名

[学会発表] ニューラル機械翻訳におけるIterative back-translationを利用したコンパラブルコーパスの活用2023

著者名/発表者名

学会等名

[学会発表] 双方向翻訳モデルの相互学習による対訳語彙の教師なし獲得過程の調査2023

著者名/発表者名

学会等名

[学会発表] 中間言語を介した２つの対訳コーパスを用いた対訳文のない言語対のNMTの検討2023

著者名/発表者名

学会等名

[学会発表] 答弁の種類に着目した抽象型要約に基づく議会会議録質問応答2023

著者名/発表者名

学会等名

[学会発表] Summarization of spoken lectures based on MMR method and important/unimportant sentence using BERT2022

著者名/発表者名

学会等名

[学会発表] Semi-supervised ASR based on iterative joint training with discrete speech synthesis2022

著者名/発表者名

学会等名

2021 年度実績報告書

中川聖一中部大学, 工学部, 客員教授 (20115893)