2009 Fiscal Year Annual Research Report
読みやすさを考慮したリアルタイム字幕生成のための話し言葉処理手法の開発
Project/Area Number |
21700157
|
Research Institution | Nagoya University |
Principal Investigator |
大野 誠寛 Nagoya University, 大学院・国際開発研究科, 助教 (20402472)
|
Keywords | 音声言語処理 / 係り受け解析 / 整形処理 / 改行処理 / 要約 |
Research Abstract |
本研究では、講演や解説などに対して読みやすい字幕をリアルタイムに生成するため、その要素技術として、次の3つの話し言葉処理手法,1)高精度化した漸進的係り受け解析手法,2)読みやすい言葉への整形処理手法,3)見やすく表示するための改行処理手法,を開発することを目的とする。初年度は、(1)漸進的係り受け解析の高精度化と(2)字幕コーパスの構築と分析を行い,下記に示す成果を得ることができた. (1) 漸進的係り受け解析の高精度化 節境界単位で閉じていない係り受けをも解析可能な係り受け解析手法を開発した.名古屋大学統合音響情報研究拠点で構築されたCIAIR同時通訳データの日本語講演音声の書き起こしデータに対して、形態素・簾境界・係り受けの情報を人手で付与したコーパス(以下、講演音声係り受けコーパス)を用いて実験し、高精度化した漸進的係り受け解析器の有効性を確認した. (2) 字幕コーパスの構築と分析 整形処理手法と改行処理手法を開発するための分析用・機械学習用データとして、講演音声係り受けコーパスに対して読みやすくなるように整形や改行を人手で施し、字幕コーパスを構築した.構築した字幕コーパスを用いて,節境界単位で閉じていない係り受けと読みにくさとの関係を明らかにした.また,適切な改行位置について、構築した字幕コーパスを用いてその特長を明らかにした.さらに,人による改行位置の違いについても明らかにした.
|
Research Products
(7 results)