• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Annual Research Report

日本語講義音声の英語字幕付き教材を生成するための音声翻訳に関する研究

Research Project

Project/Area Number 25280062
Research InstitutionToyohashi University of Technology

Principal Investigator

中川 聖一  豊橋技術科学大学, リーディング大学院教育推進機構, 特任教授 (20115893)

Co-Investigator(Kenkyū-buntansha) 秋葉 友良  豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (00356346)
井佐原 均  豊橋技術科学大学, 情報メディア基盤センター, 教授 (20358881)
山本 一公  豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (40324230)
土屋 雅稔  豊橋技術科学大学, 情報メディア基盤センター, 准教授 (70378256)
Project Period (FY) 2013-04-01 – 2017-03-31
Keywords音声認識 / 機械翻訳 / 音声翻訳 / 字幕 / 講義音声 / 日英翻訳 / 英日翻訳
Outline of Annual Research Achievements

本年度は、フレーズベースの機械翻訳以外に、階層的フレーズベース翻訳、ツリーストリングベース機械翻訳の比較研究を行い、講義音声の英日翻訳では、フレーズベース翻訳が最も優れていることを示した。
次に、講義音声中によく出てくる頻出句の日本語訳を登録し、機械翻訳の質の向上を図った。頻出句の定義として単語のnグラムと構文解析木に基づく句単位の比較、および、日本語訳の登録方法として、パラレルコーパスに頻出句の日英ペアを追加する方法とフレーズ翻訳テーブルに直接追加する方法を比較検討した。
その結果、頻出句の単位は、nグラムよりも構文解析木による句単位の方が優れていること、日本語訳の登録方法としては、直接フレーズテーブルに追加する方法が副作用が少なく優れていることが分かった。すなわち、パラレルコーパスとして追加する方法では、頻出句の日英ペアの単語列のアライメントが、他のコーパスのアライメントに悪影響を及ぼす可能性があることが分かった。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

初年度の平成25年度は、日本語講義音声の英語への翻訳を試みたが、以前から指摘されているように、英語から日本語への翻訳よりも難しく、しかも話し言葉であるため、翻訳が非常に難しいことが分かった。そこで、まず、英語の講義音声を日本語に翻訳する技術を開発することにした。この技術を最終年度に、日本語講義音声から英語への翻訳に利用するという方針にした。
平成27年度は、平成26年度に引き続いて、英語講義音声の日本語への音声翻訳システムを開発してきた。その結果、フレーズベースに基づく翻訳モデルが良いこと、講義ドメインへの適応技術として、対象ドメインの頻出句を抽出し、その日本語訳をフレーズテーブルに登録する方法が良いこと、を明らかにした。
この枠組みで、講義の話し言葉音声のパラレルコーパスを増やして行けば、機械翻訳の質は向上するであろうという見通しを得た。

Strategy for Future Research Activity

最終年度の計画は、講義音声の翻訳で問題となる音声認識の誤りに頑健な翻訳モデルの構築を図ることと、英日翻訳技術を日英翻訳技術に利用することである。
まず初めに、音声認識誤りの対策としては、講演音声であるTEDコーパスを直接音声認識し、音声誤りを含んだパラレルコーパスを構築し、これに基づいて翻訳モデルを構築することである。しかし、これには膨大な作業量を要するので、効率よく音声誤りをシミュレートできる手法を開発する。具体的には、音響的に類似な単語ペアの自動抽出、言語コンテキスト的に類似な単語ペアの自動抽出、の技術を開発し、これにより与えられた発話文の各単語に対して音響的・言語コンテキスト的に類似な単語に置換することによって、音声誤りを模擬する手法を開発する。これによって、音声誤り付きパラレルコーパスによる翻訳モデルを構築し、音声認識誤りに頑健な翻訳手法を開発する。
最後に、開発した英語講義音声を日本語テキストに翻訳する英日音声翻訳手法を日英音声翻訳に適用し、評価を行う。

Causes of Carryover

研究設備費や学会参加のための出張旅費に関して、学内の他の補助金から流用することができたため。

Expenditure Plan for Carryover Budget

最終年度は、通常以上に、学会出張費(他の研究者に技術提供を行ってもらう調査出張費も含む)に使用する。また、最終年度の評価実験のために計算機備品を購入する。

  • Research Products

    (10 results)

All 2016 2015

All Journal Article (2 results) Presentation (7 results) (of which Int'l Joint Research: 3 results,  Invited: 2 results) Book (1 results)

  • [Journal Article] 国際競争力の強化に今、求められるものーTKUNの提案ー2015

    • Author(s)
      井佐原均
    • Journal Title

      JAPIO YEARBOOK

      Volume: 2015 Pages: 80-81

  • [Journal Article] 多言語情報発信シンポジュウム2015

    • Author(s)
      井佐原均
    • Journal Title

      AAMTジャーナル

      Volume: 59 Pages: 33-39

  • [Presentation] 対象ドメイン内高頻出句の対訳作成による講義音声翻訳の検討2016

    • Author(s)
      後藤統興、山本一公、中川聖一
    • Organizer
      日本音響学会春季研究発表会
    • Place of Presentation
      東京
    • Year and Date
      2016-03-09 – 2016-03-11
  • [Presentation] ベトナム語翻訳への教師なしバイリンガルトークナイザの適用2016

    • Author(s)
      野村高広、塚田元、秋葉友良
    • Organizer
      言語処理学会年次大会
    • Place of Presentation
      仙台
    • Year and Date
      2016-03-08 – 2016-03-10
  • [Presentation] Improvement of word alignment models for Vietnameses-to-English translation2015

    • Author(s)
      Takahiro Nomura, Hajime Tsukada, Tomoyoshi Akiba
    • Organizer
      Int. Workshop on Spoken Language translation
    • Place of Presentation
      Da Nang, Vietname
    • Year and Date
      2015-12-03 – 2015-12-04
    • Int'l Joint Research
  • [Presentation] 音声処理技術がヒトの能力を超える日2015

    • Author(s)
      中川聖一
    • Organizer
      電子情報通信学会音声研究会
    • Place of Presentation
      名古屋
    • Year and Date
      2015-12-02 – 2015-12-03
    • Invited
  • [Presentation] English to Japanese spoken lecture translation system by using DNN-HMM and phrase-based SMT2015

    • Author(s)
      Norioki Goto, Kazumasa Yamamoto, Seiichi Nakagawa
    • Organizer
      Inter. Conf. Advanced Informatics: ICAICTA
    • Place of Presentation
      Chonburi, Thailand
    • Year and Date
      2015-08-20 – 2015-08-21
  • [Presentation] Compilation and Evaluation of paraphrases representation list of compound verbs towards development of "control language for action"2015

    • Author(s)
      Tomoya Shirai, Hirofumi Yabumoto, Kyoko Kanzaki, Hitoshi Isahara
    • Organizer
      Inter. Conf. Advanced Informatics: ICAICTA
    • Place of Presentation
      Chonburi, Thailand
    • Year and Date
      2015-08-20 – 2015-08-21
    • Int'l Joint Research
  • [Presentation] TAUS and Toyohashi University of Partnership2015

    • Author(s)
      Hitoshi Isahara
    • Organizer
      TAUS Tokyo Executive Forum
    • Place of Presentation
      Tokyo
    • Year and Date
      2015-04-09 – 2015-04-10
    • Int'l Joint Research / Invited
  • [Book] 今後の超高齢化社会に求められる生活支援ロボット技術2015

    • Author(s)
      寺嶋一彦(監修)、中川聖一、他97名
    • Total Pages
      622
    • Publisher
      情報機構

URL: 

Published: 2017-01-06  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi