2013 Fiscal Year Annual Research Report

日本語講義音声の英語字幕付き教材を生成するための音声翻訳に関する研究

Research Project

Project/Area Number	25280062
Research Category	Grant-in-Aid for Scientific Research (B)
Research Institution	Toyohashi University of Technology
Principal Investigator	中川聖一豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (20115893)
Co-Investigator(Kenkyū-buntansha)	井佐原均豊橋技術科学大学, 情報メディア基盤センター, 教授 (20358881) 秋葉友良豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (00356346) 土屋雅稔豊橋技術科学大学, 情報メディア基盤センター, 助教 (70378256)
Project Period (FY)	2013-04-01 – 2017-03-31
Keywords	講義音声 / 字幕 / 音声認識 / 音声翻訳 / 機械翻訳 / 整形 / 要約
Research Abstract	本研究の目的は、日本語講義音声と英語講義音声を対象に、話し言葉音声を自動認識し、その整形・要約・翻訳を統一的に扱うことによって、留学生や日本人学生の講義の理解を効果的に支援する日本語講義に対する英語字幕や英語講義に対する日本語字幕を付与する技術を開発することである。本年度は、字幕の表示方法に関する検討と英語講義音声の日本語への翻訳の初期的検討を行った。（１）字幕の表示方法の検討　　以下の５つの字幕表示方法を比較した。(a)講義音声をすべて字幕にして表示する方法（フルテキスト）、(b)重要文を抽出し、重要文だけを翻訳して表示する方法（重要文）、(c)重要な句（フレーズ）を抽出し、重要句だけを翻訳して表示する方法（重要句）、(d)重要なキーワードを抽出し、キーワードだけを翻訳して表示する方法（キーワード）、(e)字幕なし。比較の結果、英語の講義音声に対する日本人学生、および日本語講義に対する留学生は、ともに同じ傾向を示し、フルテキストだけでなく、重要文の字幕表示や重要句の字幕表示も有用であることが分かった。（２）英語講義音声の認識と日本語への翻訳　　英語講義音声の日本語字幕表示の初期的検討として、まず、英語講義音声の自動認識と統計的機械翻訳手法による英語講義音声の日本語への翻訳を行った。英語講義音声に対しては、本研究室で開発されたSPOJUS++を用いた。次に、日英の新聞記事のパラレルコーパスを用いて、オープンソースであるMosesを用いて統計的機械翻訳を行った。新聞記事と講義では、話しスタイルの相違と内容の相違があり、上手く翻訳ができないことが分かった。そこで、話し言葉であり技術的話題が多いTEDコーパスを用いた。このコーパスには、日本語字幕も付与されているため、これから日英のパラレルコーパスを作成し、機械翻訳に使用し、改善が得られた。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason まず、字幕の表示法の比較に関しては、類似研究は発表されているが、我々の比較研究は5種類の字幕表示法を比較しており、従来の3種類程度より詳細な比較研究である。また、英語講義と日本語講義の字幕表示を比較検討し、両言語で同じ傾向を示したことも評価できる。これらの結果はジャーナル論文としてまとめる予定である。英語講義音声の認識は、研究室で開発された大語彙音声認識システムSPOJUS++を使用したので、順調に実現できた。講義音声はMITの講義を使用したため、音声認識のための言語モデルには、MITの講義コーパスから作成したトライグラムを使用し、その有効性を示せた。また、統計的機械翻訳のためのパラレルコーパスをTEDコーパスから作成し、その有効性を示せたことも評価できる。日本語への変換のための日本語言語モデルも比較し、話し言葉コーパスの使用が良いことが分かったことも成果である。日本語講義音声の英語への翻訳も行い、書き言葉への整形処理や講義の教科書を用いた言語モデルの作成など種々の検討を行い、問題点を洗い出すことができた。
Strategy for Future Research Activity	講義音声の翻訳・字幕化には、以下の3つの技術が必要である。(a)音声認識技術、(b)話し言葉から書き言葉に変換し、要約、句読点の挿入など翻訳しやすいように前処理を行う技術、(c)講義の話題に適応化した言語モデルとパラレルコーパスを使用した統計的機械翻訳技術および講義で頻出する定型パターンの翻訳の利用。 (a)音声認識技術　　従来のGMM-HMMに基づく音声認識法を、ディープネットワークを利用したDNN-HMMに基づく音声認識法に変更し、認識率の改善を図る。 (b)前処理技術　　話し言葉の翻訳を容易にするための前処理として、書き言葉への変換ルールの導入、句読点の挿入、倒置表現の検出など、整形処理を行う。また、字幕はフルテキストよりも重要文だけの方が可読性が高いので、重要文の抽出も行う。 (c)音声翻訳技術　　講義を統計的機械翻訳手法で翻訳するためには、講義内容に近い日英のパラレルコーパスと言語モデルが必要である。また、統計的機械翻訳だけでは、翻訳が難しいので、講義で頻出する定型パターンを抽出し、この翻訳をパターン変換で行う手法を併用する。英語講義音声の日本語字幕付与、および日本語講義音声の英語字幕付与を開発するので、日英のパラレルコーパスや言語モデル、専門用語の翻訳辞書、等は共通に使用できるようにする。
Expenditure Plans for the Next FY Research Funding	25年度は、比較的研究が順調に進んだが、データの整理に十分な時間が取れず、遅れたので、次年度に計画を回した。日、英パラレルコーパス作成、話し言葉の書き言葉への変換ルール作成作業のための謝金を計上する。

Research Products
(7 results)

All Other

All Presentation (6 results) Remarks (1 results)

[Presentation] 外国語（英語）講義映像に対する字幕提示の理解度効果
- Author(s)
  フェルディアンシャーヴェリ, 中川聖一
- Organizer
  情報処理学会, 音声言語情報処理研究会
- Place of Presentation
  宮城県蔵王町
[Presentation] 留学生のための日本講義ビデオの字幕表示方法の比較
- Author(s)
  土井佑也, フェルディアンシャーヴェリ, 中川　聖一
- Organizer
  日本音響学会秋季研究発表会
- Place of Presentation
  豊橋技術科学大学、豊橋市
[Presentation] Automatic Speech Recognition and Machine Translation System for MIT English Lectures Using MIT and TED Corpus
- Author(s)
  Veri Ferdiansyah, 中川聖一
- Organizer
  第8回音声ドキュメント処理ワークショップ
- Place of Presentation
  豊橋市民センター、豊橋市
[Presentation] Toward Practical Use of Machine Translation
- Author(s)
  Hitoshi Isahara
- Organizer
  TAUS Tokyo Executive Forum 2013
- Place of Presentation
  Tokyo, Japan
[Presentation] Fusion of Multiple Semantic Networks and Human Association
- Author(s)
  Hitoshi Isahara, Kyoko Kanzaki, Eiko Yamamoto, Takayuki Kuribayashi and Michinaga Otsuka
- Organizer
  Seventh Global Wordnet Conference
- Place of Presentation
  Tartu, Estonia
[Presentation] 講義音声翻訳における話し言葉の整形と翻訳の同時最適化法の検討
- Author(s)
  福島太喜, 秋葉友良
- Organizer
  日本音響学会春季研究発表会
- Place of Presentation
  日本大学理工学部、東京都
[Remarks] 音声言語処理研究室
- URL
  http://www.slp.cs.tut.ac.jp

2013 Fiscal Year Annual Research Report

日本語講義音声の英語字幕付き教材を生成するための音声翻訳に関する研究

Principal Investigator

中川 聖一 豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (20115893)

Current Status of Research Progress

Reason

Research Products

[Presentation] 外国語（英語）講義映像に対する字幕提示の理解度効果

Author(s)

Organizer

Place of Presentation

[Presentation] 留学生のための日本講義ビデオの字幕表示方法の比較

Author(s)

Organizer

Place of Presentation

[Presentation] Automatic Speech Recognition and Machine Translation System for MIT English Lectures Using MIT and TED Corpus

Author(s)

Organizer

Place of Presentation

[Presentation] Toward Practical Use of Machine Translation

Author(s)

Organizer

Place of Presentation

[Presentation] Fusion of Multiple Semantic Networks and Human Association

Author(s)

Organizer

Place of Presentation

[Presentation] 講義音声翻訳における話し言葉の整形と翻訳の同時最適化法の検討

Author(s)

Organizer

Place of Presentation

[Remarks] 音声言語処理研究室

URL

中川聖一豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (20115893)