研究課題/領域番号 |
24240032
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
中村 哲 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (30263429)
|
研究分担者 |
松本 裕治 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)
戸田 智基 奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90403328)
サクリアニ サクティ 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (00395005)
NEUBIG Graham 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (70633428)
DUH Kevin 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80637322)
|
研究期間 (年度) |
2012-05-31 – 2017-03-31
|
キーワード | 音声翻訳 |
研究実績の概要 |
①同時通訳基本方式研究:平成26年度は、五月雨に翻訳結果を出力する方法をさらに改良した。方法として、フレーズベース統計翻訳における文分割を、形態素情報を使って分割する方法、さらに、Tree-to-string翻訳での部分構文構造を考慮して分割する方法を提案し、さらに高精度化を実現した。この手法を、英語講演TEDに対して適用し評価を行ない、右確率を利用した方法に比べて大幅な改善を確認した。
②コミュニケーション評価:音声同時通訳システムの評価法として、発話チャンクを検出し訳出を行う時間と翻訳性能から、同時通訳の優劣を人手による評価をもとに評価する評価手法を提案し、TED講演に対し有効性を確認した。
③同時通訳コーパス構築、プロトタイプ構築:平成26年度は、約15分の講演・ニュースを英日24本、日英60本、合計21時間の同時通訳、収録を行った。通訳は、経験年数15年、4年、1年のプロの同時通訳者よる通訳である。そのうち、英日の日本語24本の6時間分の書き起こしを行った。また、講義アーカイブ90分×35本(計3,150分=52.5時間)の日本語書き起こしを行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
同一の英語講演に対し、レベルの異なる同時通訳者による同時通訳を行い、それらの差の分析を進めた。また、この同時通訳コーパスを用いて、同時通訳アルゴリズムの高精度化を進めた。方法として、フレーズベース統計翻訳における文分割を、形態素情報を使って分割する方法、さらに、Tree-to-string翻訳での部分構文構造を考慮して分割する方法を提案し、さらなる高精度化を実現した。現在研究中の同時通訳システムが、経験年数1年のプロの通訳者に勝る性能を達成したことは特筆できる。 この同時通訳用機械翻訳モジュールを、多言語音声認識と音声合成と統合し、音声同時通訳プロトタイプを構築した。
|
今後の研究の推進方策 |
①同時通訳基本方式研究:同時通訳用機械翻訳の高度化、途中結果を五月雨的に出力する音声認識システムのさらなる改良、実装を行う。また、同時通訳に合わせて、フレーズ毎に音声を合成する音声合成システムの高度化を図る。また、入力発話に於ける強調を保持して目的言語の音声を生成する音声翻訳についての研究に着手、システムに導入する。また、深層学習法による翻訳手法についても検討を開始する。
②コミュニケーション評価:人間の同時通訳者との比較をさらに継続する。さらに、人間の翻訳者における訳出パターンにおける重要性判定からの評価尺度構築を高精度化する。
③ニュース・講演同時通訳コーパス構築、プロトタイプ構築:平成26年度は、約15分の講演・ニュースを英日24本、日英60本、合計21時間の同時通訳、収録を行った。英日の日本語の一部のデータの書き起こしが終わっているが、残りのデータの書き起こし、アノテーションを完了する。日本語のニュース、講演の音声と同時通訳の収録についても収集データをさらに増やしてゆく。
|