研究課題/領域番号 |
25280062
|
研究機関 | 豊橋技術科学大学 |
研究代表者 |
中川 聖一 豊橋技術科学大学, リーディング大学院教育推進機構, 教授 (20115893)
|
研究分担者 |
秋葉 友良 豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (00356346)
井佐原 均 豊橋技術科学大学, 情報メディア基盤センター, 教授 (20358881)
山本 一公 豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (40324230)
土屋 雅稔 豊橋技術科学大学, 情報メディア基盤センター, 准教授 (70378256)
|
研究期間 (年度) |
2013-04-01 – 2018-03-31
|
キーワード | 音声翻訳 / 音声認識 / 機械翻訳 / 日英翻訳 / 英日翻訳 / 講義音声 / 音声認識誤り |
研究実績の概要 |
講義音声の翻訳には、講義音声の音声認識とその翻訳の二つの部分からなる。まず、音声認識に関しては、話者クラス情報をディープニューラルネットワークに補助情報として入力する方法を提案し、不特定話者の音声認識に関して有効性を示した。次に、ヒトの聴覚機能を模擬するために音声分折用のフィルタバンクのフィルタ形状を学習する方法を提案した。フィルタをディープニューラルネットワークによる音声認識の前処理として用い、識別学習によるフィルタ形状を学習することにより、認識率の向上を得た。 英日翻訳に関しては、音声認識誤りに対処するために、翻訳モデルの学習に用いるテキストベースの英語ー日本語対からなるパラレルコーパスに対して、テキストの代わりに英語コーパスの音声認識結果を使用する方法と、模擬的に英語音声認識を行って音声認識誤りを自動生成した結果を使用する方法を試みた。その結果、両手法とも翻訳精度の改善に役立つことを実証した。特に、音声認識を模擬する手法は、音声データを必要としない利点がある。 最後に、本手法を、本研究の課題である日本語講義音声の英語への翻訳に適用した。しかし、語順の自由な話し言葉である日本語の講義の翻訳は非常に難しく、ベースラインが悪くて、提案手法の有効性を示すには至らなかった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
講義音声の認識に関しては、話者クラスの導入、フィルタ形状の識別学習など、新たな手法を提案し、有効性を示せた。 英語講義音声の日本語への翻訳に関しては、音声認識誤り対策法を提案し、有効性を示せた。ただし、日本語講義音声の英語への翻訳に関しては、ベースラインが悪くて、提案手法の有効性を示すには至らず、今後の課題として残った。
|
今後の研究の推進方策 |
英語講義音声の日本語への翻訳に関しては、英語の音声認識用および日本語への翻訳用の言語モデルは、それぞれ英語のNグラム、日本語のNグラムを使用してきた。最近、ニューラルネットワークに基づく言語モデルの有用性が示されていることから、後処理(リスコアリング)に、英語と日本語のLSTM(Long Short Term Memory)に基づく言語モデルを使用することを計画している。 また、日本語の講義音声の英語への翻訳に関しては、今まで考察してきた日本語の前処理(フィラーや言い直しの除去、語順の変更)、高頻度語句の英訳の登録法、音声認識誤りの対処法を見直す。
|
次年度使用額が生じた理由 |
本研究課題は、日本語講義音声の英語への翻訳が中心であったが、この課題が難しかったため、まず英語講義音声の日本語への翻訳の研究を進めてきた。これに関しては、高頻出句の人手による対訳の利用、音声認識を考慮したパラレルコーパスによる翻訳モデルの学習等により、成果が得られた。 これらの成果に基づき、日本語講義音声の英語への翻訳を試みたが、特段の効果が認められなかった。その理由は、ベースとなら日英翻訳の精度が低いためであると思われた。そのため、1年間研究期間を延長して、ベースとなる日英翻訳の精度を向上させ上で、提案法を適用する計画を立てた。そのため、今後の1年間の延期のための研究費を留保した。
|
次年度使用額の使用計画 |
日本語講義音声の英語への翻訳のための、日英パラレルコーパスの整備費、評価実験のための謝金、成果発表のための論文校閲費・旅費などの使用を計画している。
|