2011 Fiscal Year Annual Research Report
多言語動画コンテンツへの字幕付与のための柔軟な音声言語処理
Project/Area Number |
21700210
|
Research Institution | Ryukoku University |
Principal Investigator |
南條 浩輝 龍谷大学, 理工学部, 助教 (50388162)
|
Keywords | 音声認識 / 多言語処理 / 自動字幕化 |
Research Abstract |
複数言語の主音声と副音声(通訳音声)を利用して国際ニュースや国際会議の動画への字幕付与を支援するための研究を行った.具体的には同じ内容の主音声とその通訳の副音声を同時にかつ情報を互いに補いながら音声認識を行う方法について研究をすすめた.本年度は,実際の同時通訳音声データを対象として,実験をすすめた.具体的には日英の講演データ(片方の言語の音声は同時通訳音声)を対象として,日英双方の音響モデルと言語モデルのモデル化(話者適応を含む)を行って日英の音声認識システムの構築を行い,同時音声認識実験を推進した.本手法は主・副音声のうちで同一内容の発話となっている部分を必要とするため,主・副音声の同一内容発話の対応付けを行った.時間制約のみに基づく対応付けでもある程度の対応が取れることを確認し,その対応を用いた同時音声認識の有効性の検証に取り組んだ.対応が完全でなく,かつ対訳の言語情報に誤りが含まれていても,提案手法が有効に機能する可能性を明らかにした.昨年度までは,日本語の音声認識時に対訳英語情報を使用する実験のみで評価していたが,本年度は逆方向,すなわち英語の音声認識時に対訳日本語情報を使用する実験でも評価を行った.どちらも同程度の改善が得られることを確認し,提案手法は使用する言語ペアの方向(日英,英日)によらず頑健に動作することを確認した.これらの知見に関する成果報告に取り組んだ.さらに,前年度から継続して推進していた翻訳モデルの比較と計算速度の高速化について詳細に検討を行い,論文執筆をすすめた.
|