• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

読みやすさを考慮したリアルタイム字幕生成のための話し言葉処理手法の開発

研究課題

研究課題/領域番号 21700157
研究機関名古屋大学

研究代表者

大野 誠寛  名古屋大学, 大学院・国際開発研究科, 助教 (20402472)

キーワード音声言語処理 / 係り受け解析 / 整形処理 / 改行処理 / 要約
研究概要

本研究では、講演や解説などに対して読みやすい字幕をリアルタイムに生成するため、その要素技術として、次の3つの話し言葉処理手法、1)高精度化した漸進的係り受け解析手法、2)読みやすい言葉への整形処理手法、3)見やすく表示するための改行処理手法、を開発することを目的とする。平成22年度は、以下の(3)整形処理手法の開発と、(4)改行処理手法の開発を行い、下記に示す成果を得ることができた。
(3)整形処理手法の開発 節境界単位で閉じていない係り受けによって生じる読みにくい発話を、文節を移動することによって、読みやすく整形することを試みた。さらに、適切な位置に読点を挿入する手法を開発し、読みやすいテキスト生成のための基礎技術を開発した。新聞記事に対して読点挿入実験を実施し、本手法は適合率84。1%、再現率69。1%、F値75。9%を達成しており、人間による読点挿入とほぼ同程度の精度を実現することができた。
(4)改行処理手法の開発 係り受け構造や節境界情報、字幕出力の同時性、1行あたりの文字数を考慮した統計的改行処理手法を開発した。字幕出力の同時性を評価し、少なくともテキスト処理部分においては数秒程度の遅れに抑えることを達成した。また、字幕コーパスとの改行位置の一致率を評価し、本手法は、人間による改行挿入と同程度の精度を達成していることを確認した。さらに、主観的評価を実施し、本手法により生成した字幕テキストが、単純なベースラインと比べ、読みやすくなっていることを確認した。

  • 研究成果

    (3件)

すべて 2010

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (2件)

  • [雑誌論文] Construction of Linefeed Insertion Rules for Lecture Transcript and their Evaluation2010

    • 著者名/発表者名
      Masaki Murata
    • 雑誌名

      International Journal of Knowledge and Web Intelligence

      巻: Vol.1,No.3/4 ページ: 227-242

    • 査読あり
  • [学会発表] Automatic Comma Insertion for Japanese Text Generation2010

    • 著者名/発表者名
      Masaki Murata, Tomohiro Ohno, Shigeki Matsubara
    • 学会等名
      the 2010 Conference on Empirical Methods in Natural Language Processing (EMNLP2010)
    • 発表場所
      アメリカ・ボストン・マサチューセッツ工科大学
    • 年月日
      2010-10-10
  • [学会発表] 読点の用法的分類に基づく自動読点挿入2010

    • 著者名/発表者名
      村田匡輝
    • 学会等名
      情報処理学会 音声言語情報処理研究会
    • 発表場所
      東京工業大学 大岡山キャンパス
    • 年月日
      2010-05-27

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi