2010 Fiscal Year Annual Research Report
読みやすさを考慮したリアルタイム字幕生成のための話し言葉処理手法の開発
Project/Area Number |
21700157
|
Research Institution | Nagoya University |
Principal Investigator |
大野 誠寛 名古屋大学, 大学院・国際開発研究科, 助教 (20402472)
|
Keywords | 音声言語処理 / 係り受け解析 / 整形処理 / 改行処理 / 要約 |
Research Abstract |
本研究では、講演や解説などに対して読みやすい字幕をリアルタイムに生成するため、その要素技術として、次の3つの話し言葉処理手法、1)高精度化した漸進的係り受け解析手法、2)読みやすい言葉への整形処理手法、3)見やすく表示するための改行処理手法、を開発することを目的とする。平成22年度は、以下の(3)整形処理手法の開発と、(4)改行処理手法の開発を行い、下記に示す成果を得ることができた。 (3)整形処理手法の開発 節境界単位で閉じていない係り受けによって生じる読みにくい発話を、文節を移動することによって、読みやすく整形することを試みた。さらに、適切な位置に読点を挿入する手法を開発し、読みやすいテキスト生成のための基礎技術を開発した。新聞記事に対して読点挿入実験を実施し、本手法は適合率84。1%、再現率69。1%、F値75。9%を達成しており、人間による読点挿入とほぼ同程度の精度を実現することができた。 (4)改行処理手法の開発 係り受け構造や節境界情報、字幕出力の同時性、1行あたりの文字数を考慮した統計的改行処理手法を開発した。字幕出力の同時性を評価し、少なくともテキスト処理部分においては数秒程度の遅れに抑えることを達成した。また、字幕コーパスとの改行位置の一致率を評価し、本手法は、人間による改行挿入と同程度の精度を達成していることを確認した。さらに、主観的評価を実施し、本手法により生成した字幕テキストが、単純なベースラインと比べ、読みやすくなっていることを確認した。
|