ニューラルネットワーク言語モデルの適応的な自動構成法

研究課題

研究課題/領域番号	18K11354
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分61010:知覚情報処理関連
研究機関	京都大学
研究代表者	秋田祐哉京都大学, 経済学研究科, 教授 (90402742)
研究期間 (年度)	2018-04-01 – 2023-03-31
研究課題ステータス	完了 (2022年度)
配分額 *注記	4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円) 2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円) 2019年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円) 2018年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
キーワード	音声認識 / ニューラルネットワーク / 言語モデル
研究成果の概要	音声認識において，一般的な話題のテキストデータから学習したモデルでは，講義・講演のような専門性のある内容の音声を高い精度で書き起こすことは難しい．このための方策として，言語モデルを特定の話題に適応する，いわゆる言語モデル適応がある．本研究では，認識対象の音声とともに与えられる話題関連のテキストを用いて，ニューラルネットワークに基づく言語モデルに対して自動的に適応処理を行い，自動的に音声の字幕を作成するシステムを構成した．本システムは，適応したモデルによる事後的な字幕の作成だけでなく，リアルタイムの字幕付与も行うことができる．
研究成果の学術的意義や社会的意義	音声認識はコミュニケーションの支援技術として社会的な重要性が増大しているが，専門的な内容を含む音声に対してニューラルネットワークのような高度なモデルを適用することには技術的な困難がある．本研究により，非専門家がより性能の高い音声認識を容易に取り扱えるようになることには，大きな意義があると考えられる．

報告書

(6件)

研究成果
(2件)

すべて 2020 2019

すべて学会発表 (2件)

[学会発表] 自動字幕作成システムにおけるモデルの拡張2020
- 著者名/発表者名
  秋田祐哉・上乃聖・三村正人・河原達也
- 学会等名
  情報処理学会アクセシビリティ研究会
- 関連する報告書
  2019 実施状況報告書
[学会発表] 音声認識を用いた字幕作成システムの改良2019
- 著者名/発表者名
  秋田祐哉・上乃聖・三村正人・河原達也
- 学会等名
  情報処理学会アクセシビリティ研究会
- 関連する報告書
  2018 実施状況報告書