研究課題/領域番号 |
25280062
|
研究機関 | 豊橋技術科学大学 |
研究代表者 |
中川 聖一 豊橋技術科学大学, リーディング大学院教育推進機構, 特命教授 (20115893)
|
研究分担者 |
秋葉 友良 豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (00356346)
井佐原 均 豊橋技術科学大学, 情報メディア基盤センター, 教授 (20358881)
山本 一公 中部大学, 工学部, 准教授 (40324230)
土屋 雅稔 豊橋技術科学大学, 情報メディア基盤センター, 准教授 (70378256)
|
研究期間 (年度) |
2013-04-01 – 2018-03-31
|
キーワード | 講義の字幕化 / 講義音声 / 日本語講義 / 音声認識 / 日英翻訳 / 英日翻訳 / 音声翻訳 |
研究実績の概要 |
本研究課題が当初の予想よりも困難であったため、1年間研究期間を延長した。困難であった理由は、我々の使用した日本語講義音声の認識が比較的難しかったこと、および日本語講義の英語への翻訳が極めて難しかったためである。例えば、英語のオープンコースウエアであるMIT講義音声の認識率は、単語換算で約80%であるのに対し、日本語講義音声の認識率は、単語換算で約60%であった。また、MIT講義の日本語への翻訳精度はBLEU値で約15であったのに対し、我々の使用した日本語講義の英語への翻訳精度は約10であった。そこで、まず、基本技術の確立を目指し、2年度目から英語講義音声の翻訳に重心を移した。 本年度は、研究のまとめとして、4年度目の成果を引き継ぎ、翻訳性能を引き上げるために、複数翻訳候補のリスコアリングの研究を行った。その結果、複数音声認識システムの音声認識結果から翻訳した複数翻訳候補から、言語モデルによるリスコアリングで翻訳性能が向上することを示した。 また、最近著しい成果が得られているニューラルネットワークによる翻訳の利用も検討した。ニューラルネットによる機械翻訳(ニューラル機械翻訳)は、本研究の計画段階ではまだ注目されていなかった技術であり、計画外の技術である。この技術による翻訳結果と従来の統計的機械翻訳による翻訳結果のリスコアリングを検討した。 リスコアリング手法として、翻訳結果文の意味ベクトルと原文の意味べクトルによる比較による手法と、翻訳結果の英語への逆翻訳と原文との比較による手法を提案した。特に、逆翻訳によるリスコアリング手法は有用であることを示した。 最後に、これらの手法を日本語講義音声の英語への翻訳に適用を進めているが、まだ未発表である。
|
現在までの達成度 (段落) |
29年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
29年度が最終年度であるため、記入しない。
|