• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Annual Research Report

半自律的な音声認識による講演・講義への字幕付与

Research Project

Project/Area Number 16H02847
Research InstitutionKyoto University

Principal Investigator

河原 達也  京都大学, 情報学研究科, 教授 (00234104)

Co-Investigator(Kenkyū-buntansha) 秋田 祐哉  京都大学, 経済学研究科, 講師 (90402742)
Project Period (FY) 2016-04-01 – 2019-03-31
Keywords音声認識 / コンテンツ・アーカイブ / 機械学習 / 字幕付与
Outline of Annual Research Achievements

放送大学の講義と学会の講演を主な対象として、音声認識の半自律的な学習の枠組みを検討し、字幕付与システムを実装・公開・試験運用した。
(1) 音声認識、特に音響モデルの半自律的な学習の枠組みを検討した。まず、字幕テキストと複数の音声認識結果に基づいて、音声認識の音響モデルを学習するための教師ラベルを生成し、準教師付き学習(lightly-supervised training)を実現した。次に、既存の大規模な学習データベースと組み合わせる半教師付き学習(semi-supervised training)を実現した。また、ディープニューラルネットワークのマルチタスク学習などの方法も検討した。
(2) 音声認識に基づく字幕付与システム(http://caption.ist.i.kyoto-u.ac.jp/)を公開・試験運用した。放送大学の複数の講義を対象に、音声認識結果を修正・編集することにより、実際に字幕を作成してもらった。また、情報処理学会の複数の研究会などで、リアルタイム字幕付与の試験運用を実施した。
(3) 英語や中国語の講演コンテンツ(TEDやCCTVの「百家講壇」)を対象に字幕を付与し、これらの言語を学習する日本人のリスニング訓練に応用することを研究した。自動音声認識が困難な箇所と学習者のリスニングが困難な箇所との関係について分析し、これを用いた字幕提示法を提案した。
(4) 『聴覚障害者のための字幕付与技術』シンポジウムを開催し、聴覚障害者・要約筆記ボランティアに加えて、会議録を作成している速記者やテレビ字幕を作成している方と字幕付与の方法について情報交換・議論を行った。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

論文発表に加えて、報道発表も行った。

Strategy for Future Research Activity

引き続き、システムの試験運用と改善を行う。

  • Research Products

    (9 results)

All 2017 2016 Other

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 2 results) Presentation (5 results) (of which Int'l Joint Research: 5 results) Remarks (2 results)

  • [Journal Article] Semi-supervised acoustic model training by discriminative data selection from multiple ASR systems' hypotheses2016

    • Author(s)
      S.Li, Y.Akita, and T.Kawahara
    • Journal Title

      IEEE/ACM Trans. Audio, Speech & Language Processing

      Volume: 24 Pages: 1524--1534

    • DOI

      10.1109/TASLP.2016.2562505

    • Peer Reviewed / Open Access
  • [Journal Article] 傾聴対話システムのための言語情報と韻律情報に基づく 多様な形態の相槌の生成2016

    • Author(s)
      山口貴史, 井上昂治, 吉野幸一郎, 高梨克也, NigelG. Ward, 河原達也
    • Journal Title

      人工知能学会論文誌

      Volume: 31 Pages: C-G31_1--10

    • DOI

      10.1527/tjsai.C-G31

    • Peer Reviewed / Open Access
  • [Presentation] Semi-supervised ensemble DNN acoustic model training2017

    • Author(s)
      S.Li, X.Lu, S.Sakai, M.Mimura, and T.Kawahara
    • Organizer
      IEEE-ICASSP
    • Place of Presentation
      米国・ニューオーリンズ
    • Year and Date
      2017-03-05 – 2017-03-09
    • Int'l Joint Research
  • [Presentation] Effective articulatory modeling for pronunciation error detection of L2 learner without non-native training data2017

    • Author(s)
      R.Duan, T.Kawahara, M.Dantsuji, and J.Zhang
    • Organizer
      IEEE-ICASSP
    • Place of Presentation
      米国・ニューオーリンズ
    • Year and Date
      2017-03-05 – 2017-03-09
    • Int'l Joint Research
  • [Presentation] Multi-lingual and multi-task DNN learning for articulatory error detection2016

    • Author(s)
      R.Duan, T.Kawahara, M.Dantsuji, and J.Zhang
    • Organizer
      APSIPA ASC
    • Place of Presentation
      韓国・済州
    • Year and Date
      2016-12-13 – 2016-12-16
    • Int'l Joint Research
  • [Presentation] Prediction and generation of backchannel form for attentive listening systems2016

    • Author(s)
      T.Kawahara, T.Yamaguchi, K.Inoue, K.Takanashi, and N.Ward
    • Organizer
      INTERSPEECH
    • Place of Presentation
      米国・サンフランシスコ
    • Year and Date
      2016-09-08 – 2016-09-12
    • Int'l Joint Research
  • [Presentation] Leveraging automatic speech recognition errors to detect challenging speech segments in TED talks2016

    • Author(s)
      M.Mirzaei, K.Meshgi, and T.Kawahara
    • Organizer
      EUROCALL
    • Place of Presentation
      キプロス・リマソル
    • Year and Date
      2016-08-24 – 2016-08-27
    • Int'l Joint Research
  • [Remarks] 音声認識を用いた自動字幕作成システム

    • URL

      http://caption.ist.i.kyoto-u.ac.jp/

  • [Remarks] 音声認識技術を用いた字幕付与支援

    • URL

      http://sap.ist.i.kyoto-u.ac.jp/jimaku/

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi