研究課題/領域番号 |
25730112
|
研究種目 |
若手研究(B)
|
研究機関 | 京都大学 |
研究代表者 |
秋田 祐哉 京都大学, 学術情報メディアセンター, 助教 (90402742)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | 音声認識 / 自動整形 / 話し言葉 / 字幕 |
研究概要 |
音声認識を字幕などに活用する際は,まず音声認識器が話し言葉特有の表現をカバーした上で認識を行い,その結果に含まれる冗長表現・口語表現を読みやすく整形するというアプローチが取られる.本研究ではこれらを話し言葉への変換とその逆変換としてとらえ,変換の方向とは独立した話し言葉の特徴のモデルを構築し,このモデルに基づく音声認識(変換)と自動整形(逆変換)の実現を図る.また本研究では,一連の処理を行うプラットフォームとして字幕の生成・配信システムを構築する. 平成25年度では,字幕作成・配信のプロトタイプシステムを開発した.これは,インターネット上のサーバで一般のユーザからコンテンツを受け付け,音声認識を用いて自動的に字幕の草稿を作成し,ユーザがオンラインの専用エディタでこれを編集するシステムである.ここでは,音声認識と自動整形のモデルについて,各種の音声・テキストデータベースを用いて構築し,実際に投入されるデータに対して適用している.このオフライン型のシステムとは別に,リアルタイム字幕付与のために,字幕としての有用性の観点から音声認識結果を自動的に分類する手法を検討し,これに基づくシステムを開発・試行した.これらのシステムの開発・試験運用を通じて,実際の講義・講演音声とその書き起こし・字幕データの収集を行った.これらのシステムについては国内の学会で発表を行っている.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
分析のための音声・テキストデータは順調に収集できている.音声認識と自動整形を組み込んだ字幕作成システムはプロトタイプから本格的な公開・運用に移る段階である.
|
今後の研究の推進方策 |
計画通り,音声認識と自動整形のための話し言葉のモデルについて分析を進めて精緻化を図るとともに,これらの統合を進める.開発した字幕作成システムを通じて評価を実施する.
|
次年度の研究費の使用計画 |
当該年度に人件費・謝金を執行する必要がなかったため. 次年度の人件費・謝金として執行する予定である.
|