研究概要 |
本研究では,講演や解説,ニュースなどの独話データに対する効率的なアクセスや効果的な再利用、また,独話のリアルタイムで効率的な理解を支援するための独話処理技術を開発することを目的としている.第2年度は,初年度で開発した独話構造解析器の有効性を評価・分析し,独話構造解析器の更なる性能改善を図った.さらに,独話構造解析器を用いた応用システムとして,リアルタイム字幕生成のための要約手法を開発し,下記に示す成果を得ることができた. 1.独話の係り受け解析器の評価・改良 1年目で構築した構造付独話コーパスを用いて実験を行い,開発した独話構造解析器の有効性を評価した.放送などで行われる比較的整った講演の実データに対して,少なくとも70%以上の部分を構造化でき,かつ,話し手の話速に追従できる程度の解析の漸進性,及び,解析速度を備えていることを確認した.初年度で開発した独話構造解析器では,節境界をまたぐ係り受けは存在しないと仮定しおり,このような係り受けは解析できなかったが,この仮定に逸脱した係り受けの解析可能性を探り,実験結果に対する分析に基づき改良を加え,解析精度の向上を図った. 2.独話構造解析に基づいたリアルタイム字幕生成のための要約手法の開発 構造上のつながりを保ちながら,明らかに意味内容が重複している箇所や重要性の低い箇所を削除することによる要約手法を開発した.さらに,上述の要約手法と初年度で開発した漸進的構造解析手法を統合することにより,リアルタイム字幕生成システムに応用可能な音声に追従して要約を行う手法を開発した.
|