2011 Fiscal Year Annual Research Report

多言語動画コンテンツへの字幕付与のための柔軟な音声言語処理

Research Project

Project/Area Number	21700210
Research Institution	Ryukoku University
Principal Investigator	南條浩輝龍谷大学, 理工学部, 助教 (50388162)
Keywords	音声認識 / 多言語処理 / 自動字幕化
Research Abstract	複数言語の主音声と副音声(通訳音声)を利用して国際ニュースや国際会議の動画への字幕付与を支援するための研究を行った.具体的には同じ内容の主音声とその通訳の副音声を同時にかつ情報を互いに補いながら音声認識を行う方法について研究をすすめた.本年度は,実際の同時通訳音声データを対象として,実験をすすめた.具体的には日英の講演データ(片方の言語の音声は同時通訳音声)を対象として,日英双方の音響モデルと言語モデルのモデル化(話者適応を含む)を行って日英の音声認識システムの構築を行い,同時音声認識実験を推進した.本手法は主・副音声のうちで同一内容の発話となっている部分を必要とするため,主・副音声の同一内容発話の対応付けを行った.時間制約のみに基づく対応付けでもある程度の対応が取れることを確認し,その対応を用いた同時音声認識の有効性の検証に取り組んだ.対応が完全でなく,かつ対訳の言語情報に誤りが含まれていても,提案手法が有効に機能する可能性を明らかにした.昨年度までは,日本語の音声認識時に対訳英語情報を使用する実験のみで評価していたが,本年度は逆方向,すなわち英語の音声認識時に対訳日本語情報を使用する実験でも評価を行った.どちらも同程度の改善が得られることを確認し,提案手法は使用する言語ペアの方向(日英,英日)によらず頑健に動作することを確認した.これらの知見に関する成果報告に取り組んだ.さらに,前年度から継続して推進していた翻訳モデルの比較と計算速度の高速化について詳細に検討を行い,論文執筆をすすめた.

Research Products
(3 results)

All 2012 2011

All Journal Article (1 results) Presentation (2 results)

[Journal Article] 英日同時通訳における英語および日本語の音声認識の検討2012
- Author(s)
  大村絵梨, 南條浩輝
- Journal Title
  
  日本音響学会2012年春季研究発表会講演論文集
  
  Pages: 249-250
[Presentation] 英日同時通訳音声の音声認識2012
- Author(s)
  大村絵梨, 南條浩輝
- Organizer
  第6回音声ドキュメント処理ワークショップ
- Place of Presentation
  豊橋技術科学大学(愛知県)
- Year and Date
  2012-03-03
[Presentation] 英日同時通訳音声を対象とした音声認識2011
- Author(s)
  大村絵梨, 南條浩輝
- Organizer
  日本音響学会関西支部第14回関西支部若手研究者交流研究発表会
- Place of Presentation
  産業技術総合研究所関西センター(大阪府)
- Year and Date
  2011-12-18

2011 Fiscal Year Annual Research Report

多言語動画コンテンツへの字幕付与のための柔軟な音声言語処理

Principal Investigator

南條 浩輝 龍谷大学, 理工学部, 助教 (50388162)

Research Products

[Journal Article] 英日同時通訳における英語および日本語の音声認識の検討2012

Author(s)

Journal Title

[Presentation] 英日同時通訳音声の音声認識2012

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 英日同時通訳音声を対象とした音声認識2011

Author(s)

Organizer

Place of Presentation

Year and Date

南條浩輝龍谷大学, 理工学部, 助教 (50388162)