研究課題/領域番号 |
18K11354
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 京都大学 |
研究代表者 |
秋田 祐哉 京都大学, 経済学研究科, 教授 (90402742)
|
研究期間 (年度) |
2018-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2019年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2018年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | 音声認識 / ニューラルネットワーク / 言語モデル |
研究成果の概要 |
音声認識において,一般的な話題のテキストデータから学習したモデルでは,講義・講演のような専門性のある内容の音声を高い精度で書き起こすことは難しい.このための方策として,言語モデルを特定の話題に適応する,いわゆる言語モデル適応がある.本研究では,認識対象の音声とともに与えられる話題関連のテキストを用いて,ニューラルネットワークに基づく言語モデルに対して自動的に適応処理を行い,自動的に音声の字幕を作成するシステムを構成した.本システムは,適応したモデルによる事後的な字幕の作成だけでなく,リアルタイムの字幕付与も行うことができる.
|
研究成果の学術的意義や社会的意義 |
音声認識はコミュニケーションの支援技術として社会的な重要性が増大しているが,専門的な内容を含む音声に対してニューラルネットワークのような高度なモデルを適用することには技術的な困難がある.本研究により,非専門家がより性能の高い音声認識を容易に取り扱えるようになることには,大きな意義があると考えられる.
|