研究課題/領域番号 |
24240032
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
中村 哲 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (30263429)
|
研究分担者 |
松本 裕治 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)
戸田 智基 奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90403328)
サクリアニ サクティ 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (00395005)
NEUBIG Graham 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (70633428)
DUH Kevin 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80637322)
|
研究期間 (年度) |
2012-05-31 – 2017-03-31
|
キーワード | 同時通訳 / 音声翻訳 / 音声認識 / 機械翻訳 |
研究概要 |
①同時通訳基本方式研究:平成25年度は、五月雨に翻訳結果を出力する新たな方法として、フレーズベース統計翻訳における右確率を用いた同時通訳方法を提案した。右確率は原言語と対象言語で語順の入れ替えが起こりやすいかどうかを判別する確率であり、日本語と英語のように語順の異なる言語には極めて効果的である。この手法を、英語講演TEDに対して適用し評価を行ったところ、同時通訳経験1年のプロの通訳とほぼ同等の性能が得られることが明らかになった。 ②コミュニケーション評価:音声同時通訳システムの評価法として、発話チャンクを検出し訳出を行う時間と、翻訳性能のカーブから性能評価を行う手法を提案した。 ③同時通訳コーパス構築、プロトタイプ構築:平成25年度は、英語のTED講演のうち、34ないし46講演に対し、経験年数15年、4年、1年のプロの同時通訳者に通訳をしてもらい、同時通訳コーパス20時間の収録を終了した。これらのコーパスの書き起こし、時間的なアライメントを行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
同一の英語講演に対し、レベルの異なる同時通訳者による同時通訳を行い、それらの差の分析を進めた。また、この同時通訳コーパスを用いて、機械翻訳システムのチューニングを行い、同時通訳システムの性能向上を進めた。現在研究中の同時通訳システムが、経験年数1年のプロの通訳者と同等の性能を達成したことは特筆できる。 日英双方向の同時通訳に並行して、英仏の同時通訳実験も行い、同じ文構造(SVO)の言語間の場合に、本研究で提案した右確率による方法を用いれば、短く区切りながら同時通訳を行っても比較的性能劣化がないことも明らかとなった。 この同時通訳用機械翻訳モジュールを、ポーズ区切りで認識結果を出力する音声認識と音声合成と統合し、音声同時通訳プロトタイプを構築した。
|
今後の研究の推進方策 |
①同時通訳基本方式研究:同時通訳用機械翻訳の高度化、途中結果を五月雨的に出力する音声認識システムの改良、実装を行う。また、同時通訳に合わせて、フレーズ毎に音声を合成する音声合成システムの高度化を図る。音声認識、機械翻訳用の言語モデルについては講演トピックに合わせた類似コーパスを事前に利用する仕組みについてさらに研究を行う。 ②コミュニケーション評価:人間の同時通訳者との比較をさらに継続する。さらに、人間の翻訳者における訳出パターンにおける重要性判定からの評価尺度構築を行う。 ③ニュース・講演同時通訳コーパス構築、プロトタイプ構築:これまで、英語の講演は20時間の収録を終了したが、日本語のニュース、講演の音声と同時通訳の収録が若干遅れているので、これらのデータ収集、アノテーション作業を行う。
|