• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実績報告書

日本語講義音声の英語字幕付き教材を生成するための音声翻訳に関する研究

研究課題

研究課題/領域番号 25280062
研究機関豊橋技術科学大学

研究代表者

中川 聖一  豊橋技術科学大学, リーディング大学院教育推進機構, 特任教授 (20115893)

研究分担者 秋葉 友良  豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (00356346)
井佐原 均  豊橋技術科学大学, 情報メディア基盤センター, 教授 (20358881)
山本 一公  豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (40324230)
土屋 雅稔  豊橋技術科学大学, 情報メディア基盤センター, 准教授 (70378256)
研究期間 (年度) 2013-04-01 – 2017-03-31
キーワード音声認識 / 機械翻訳 / 音声翻訳 / 字幕 / 講義音声 / 日英翻訳 / 英日翻訳
研究実績の概要

本年度は、フレーズベースの機械翻訳以外に、階層的フレーズベース翻訳、ツリーストリングベース機械翻訳の比較研究を行い、講義音声の英日翻訳では、フレーズベース翻訳が最も優れていることを示した。
次に、講義音声中によく出てくる頻出句の日本語訳を登録し、機械翻訳の質の向上を図った。頻出句の定義として単語のnグラムと構文解析木に基づく句単位の比較、および、日本語訳の登録方法として、パラレルコーパスに頻出句の日英ペアを追加する方法とフレーズ翻訳テーブルに直接追加する方法を比較検討した。
その結果、頻出句の単位は、nグラムよりも構文解析木による句単位の方が優れていること、日本語訳の登録方法としては、直接フレーズテーブルに追加する方法が副作用が少なく優れていることが分かった。すなわち、パラレルコーパスとして追加する方法では、頻出句の日英ペアの単語列のアライメントが、他のコーパスのアライメントに悪影響を及ぼす可能性があることが分かった。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

初年度の平成25年度は、日本語講義音声の英語への翻訳を試みたが、以前から指摘されているように、英語から日本語への翻訳よりも難しく、しかも話し言葉であるため、翻訳が非常に難しいことが分かった。そこで、まず、英語の講義音声を日本語に翻訳する技術を開発することにした。この技術を最終年度に、日本語講義音声から英語への翻訳に利用するという方針にした。
平成27年度は、平成26年度に引き続いて、英語講義音声の日本語への音声翻訳システムを開発してきた。その結果、フレーズベースに基づく翻訳モデルが良いこと、講義ドメインへの適応技術として、対象ドメインの頻出句を抽出し、その日本語訳をフレーズテーブルに登録する方法が良いこと、を明らかにした。
この枠組みで、講義の話し言葉音声のパラレルコーパスを増やして行けば、機械翻訳の質は向上するであろうという見通しを得た。

今後の研究の推進方策

最終年度の計画は、講義音声の翻訳で問題となる音声認識の誤りに頑健な翻訳モデルの構築を図ることと、英日翻訳技術を日英翻訳技術に利用することである。
まず初めに、音声認識誤りの対策としては、講演音声であるTEDコーパスを直接音声認識し、音声誤りを含んだパラレルコーパスを構築し、これに基づいて翻訳モデルを構築することである。しかし、これには膨大な作業量を要するので、効率よく音声誤りをシミュレートできる手法を開発する。具体的には、音響的に類似な単語ペアの自動抽出、言語コンテキスト的に類似な単語ペアの自動抽出、の技術を開発し、これにより与えられた発話文の各単語に対して音響的・言語コンテキスト的に類似な単語に置換することによって、音声誤りを模擬する手法を開発する。これによって、音声誤り付きパラレルコーパスによる翻訳モデルを構築し、音声認識誤りに頑健な翻訳手法を開発する。
最後に、開発した英語講義音声を日本語テキストに翻訳する英日音声翻訳手法を日英音声翻訳に適用し、評価を行う。

次年度使用額が生じた理由

研究設備費や学会参加のための出張旅費に関して、学内の他の補助金から流用することができたため。

次年度使用額の使用計画

最終年度は、通常以上に、学会出張費(他の研究者に技術提供を行ってもらう調査出張費も含む)に使用する。また、最終年度の評価実験のために計算機備品を購入する。

  • 研究成果

    (10件)

すべて 2016 2015

すべて 雑誌論文 (2件) 学会発表 (7件) (うち国際学会 3件、 招待講演 2件) 図書 (1件)

  • [雑誌論文] 国際競争力の強化に今、求められるものーTKUNの提案ー2015

    • 著者名/発表者名
      井佐原均
    • 雑誌名

      JAPIO YEARBOOK

      巻: 2015 ページ: 80-81

  • [雑誌論文] 多言語情報発信シンポジュウム2015

    • 著者名/発表者名
      井佐原均
    • 雑誌名

      AAMTジャーナル

      巻: 59 ページ: 33-39

  • [学会発表] 対象ドメイン内高頻出句の対訳作成による講義音声翻訳の検討2016

    • 著者名/発表者名
      後藤統興、山本一公、中川聖一
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      東京
    • 年月日
      2016-03-09 – 2016-03-11
  • [学会発表] ベトナム語翻訳への教師なしバイリンガルトークナイザの適用2016

    • 著者名/発表者名
      野村高広、塚田元、秋葉友良
    • 学会等名
      言語処理学会年次大会
    • 発表場所
      仙台
    • 年月日
      2016-03-08 – 2016-03-10
  • [学会発表] Improvement of word alignment models for Vietnameses-to-English translation2015

    • 著者名/発表者名
      Takahiro Nomura, Hajime Tsukada, Tomoyoshi Akiba
    • 学会等名
      Int. Workshop on Spoken Language translation
    • 発表場所
      Da Nang, Vietname
    • 年月日
      2015-12-03 – 2015-12-04
    • 国際学会
  • [学会発表] 音声処理技術がヒトの能力を超える日2015

    • 著者名/発表者名
      中川聖一
    • 学会等名
      電子情報通信学会音声研究会
    • 発表場所
      名古屋
    • 年月日
      2015-12-02 – 2015-12-03
    • 招待講演
  • [学会発表] English to Japanese spoken lecture translation system by using DNN-HMM and phrase-based SMT2015

    • 著者名/発表者名
      Norioki Goto, Kazumasa Yamamoto, Seiichi Nakagawa
    • 学会等名
      Inter. Conf. Advanced Informatics: ICAICTA
    • 発表場所
      Chonburi, Thailand
    • 年月日
      2015-08-20 – 2015-08-21
  • [学会発表] Compilation and Evaluation of paraphrases representation list of compound verbs towards development of "control language for action"2015

    • 著者名/発表者名
      Tomoya Shirai, Hirofumi Yabumoto, Kyoko Kanzaki, Hitoshi Isahara
    • 学会等名
      Inter. Conf. Advanced Informatics: ICAICTA
    • 発表場所
      Chonburi, Thailand
    • 年月日
      2015-08-20 – 2015-08-21
    • 国際学会
  • [学会発表] TAUS and Toyohashi University of Partnership2015

    • 著者名/発表者名
      Hitoshi Isahara
    • 学会等名
      TAUS Tokyo Executive Forum
    • 発表場所
      Tokyo
    • 年月日
      2015-04-09 – 2015-04-10
    • 国際学会 / 招待講演
  • [図書] 今後の超高齢化社会に求められる生活支援ロボット技術2015

    • 著者名/発表者名
      寺嶋一彦(監修)、中川聖一、他97名
    • 総ページ数
      622
    • 出版者
      情報機構

URL: 

公開日: 2017-01-06  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi