2009 Fiscal Year Annual Research Report

多言語動画コンテンツへの字幕付与のための柔軟な音声言語処理

Research Project

Project/Area Number	21700210
Research Institution	Ryukoku University
Principal Investigator	南條浩輝 Ryukoku University, 理工学部, 助教 (50388162)
Keywords	音声認識 / 多言語処理 / 自動字幕化
Research Abstract	複数言語の主音声と副音声(通訳音声)を利用して国際ニュースや国際会議の動画への字幕付与を支援するための研究を行った,具体的には"同じ内容の音声が複数の言語でなされている状況(実際にニュースなどではこのケースが多い)"に着目し,主音声とその通訳の副音声を同時にかっ情報を補完しあいながら,より頑健に音声認識を行う方法について研究をすすめた.日本語音声と英語音声を同時に音声認識することを目標とし,予備実験データを用いて実験を行った.提案する同時音声認識においては同一内容の日本語と英語の対応づけスコアが重要であるため,本年度はこれを高精度にかっ高速に計算するための翻訳モデルおよびそのスコアの計算方法について中心的に研究を行った.具体的には,英語情報を用いた日本語の音声認識において,翻訳モデルの学習データと評価データのドメインの違いの影響,学習データ量の影響,および統計的翻訳モデルとしてどのモデル(IBMモデル1から3)が適しているかを調査した.翻訳モデルの効果を調べるために,英語の音声認識誤りの影響を除いて実験を行った.データ量が多いほうが精度の高い翻訳モデルを学習できること,およびドメインが異なるデータを単純に加えても効果が低いことを確認した.翻訳モデルとしてはIBMモデル3が精度の面で適していることがわかった。また翻訳モデルスコア(対応づけスコア)の計算においては,厳密な計算を行わずに近似を行っても音声認識への影響は大きくないことがわかった.対応スコア計算時間の短縮が可能となり,実時間動作システムの実現に近づいた.

Research Products
(2 results)

All Journal Article (1 results) Presentation (1 results)

[Journal Article] 多言語音声の同時認識のための統計的翻訳モデル2010
- Author(s)
  大村絵梨, 南條浩輝
- Journal Title
  
  情報処理学会創立50周年記念(第72回)全国大会 DVD
  
  Pages: 2-245-2-246
[Presentation] 国際TV放送への自動字幕付与のための音声認識～主音声・副音声の同時音声認識～2009
- Author(s)
  大村絵梨, 南條浩輝
- Organizer
  第12回関西支部若手研究者交流研究発表会
- Place of Presentation
  関西大学
- Year and Date
  2009-12-05