2015 Fiscal Year Annual Research Report
Simultaneous speech translation methods for news and lectures in foreign languages
Project/Area Number |
24240032
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
中村 哲 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (30263429)
|
Co-Investigator(Kenkyū-buntansha) |
松本 裕治 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)
サクリアニ サクティ 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (00395005)
Neubig Graham 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (70633428)
Duh Kevin 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80637322)
戸田 智基 奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90403328)
|
Project Period (FY) |
2012-05-31 – 2017-03-31
|
Keywords | 音声情報処理 |
Outline of Annual Research Achievements |
①同時通訳基本方式研究:平成27年度は、品詞情報をもとに、訳文に単語順序の入れ替えが発生するかを予測するモデルを構築し、同時通訳精度の改善を試みた。また、ニューラル翻訳を実装し、統計翻訳のリランキングに用いることで性能改善できることを示した。 ②コミュニケーション評価:音声認識における置換、挿入、脱落誤りに対する発話者の反応測定を行った。誤り単語の品詞や、役割によって認知負荷が異なることが明らかとなった。 ③同時通訳コーパス構築、プロトタイプ構築:同時通訳(日→英)9時間分(Aクラス18データ、Bクラス24データ)、同時通訳(英→日)7時間分(30データ)の書き起こし、講義10コマ分の日英翻訳を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
同一の英語講演に対し、レベルの異なる同時通訳者による同時通訳を行い、それらの差の分析を進めた。また、この同時通訳コーパスを用いて、同時通訳アルゴリズムの高精度化を進めた。方法として、フレーズベース統計翻訳における文分割を、形態素情報を使って分割する方法を提案し、さらなる高精度化を実現した。現在研究中の同時通訳システムが、経験年数1年のプロの通訳者に勝る性能を達成したことは特筆できる。この同時通訳用機械翻訳モジュールを、多言語音声認識と音声合成と統合し、音声同時通訳プロトタイプを構築した。
|
Strategy for Future Research Activity |
①同時通訳基本方式研究:同時通訳用機械翻訳の高度化、途中結果を五月雨的に出力する音声認識システムのさらなる改良、実装を行う。入力発話に於ける強調を保持して目的言語の音声を生成する音声翻訳についての研究に着手、システムに導入する。また、深層学習法による翻訳手法についても検討を開始する。
②コミュニケーション評価:人間の同時通訳者との比較をさらに継続する。さらに、人間の翻訳者における訳出パターンにおける重要性判定からの評価尺度構築を高精度化する。
③ニュース・講演同時通訳コーパス構築、プロトタイプ構築:平成26年度は、21時間のニュース、講演の収録を終了した。一部データの書き起こしが終わっているが、残りのデータの書き起こし、アノテーションを完了する。日本語のニュース、講演の音声と同時通訳の収録についても収集データをさらに増やしてゆく
|
Research Products
(16 results)