• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実績報告書

Web音声インデキシングのための言語的特性の変動に頑健な音声認識に関する研究

研究課題

研究課題/領域番号 23700225
研究機関独立行政法人産業技術総合研究所

研究代表者

緒方 淳  独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (10392599)

キーワードコンテンツ・アーカイブ / ディレクトリ・情報検索 / 知能ロボティックス / 機械学習 / 音声認識・理解
研究概要

Web上に膨大に存在する音声コンテンツ (動画、ポッドキャスト等) から、ユーザが欲しい情報を検索したり、快適な鑑賞を行うためには、音声データを正しく音声認識し、インデキシングを行う技術が必要不可欠である。しかし、現状の音声認識システムは実環境の様々な変動に対して頑健ではないため、Web 上の音声データの認識は困難である。そこで本研究では、Web 上の様々な言語資源を活用することで、音声認識における話題や語彙、発話スタイルといった言語的特性の変動に対する頑健性をいかに高めていけるかを学術的目的とする。
24年度では、まず、前年度に構築したWebニューステキストによる言語モデルを、日々配信される最新のニューステキストをもとに、日常的に自動更新できるように拡張した。これにより、言語モデルが、日々移り変わる世の中の情勢や話題を逐次追従していく仕組みを実現した。また、獲得した新出語の読み情報を、外部のWebキーワード辞書サービス(はてなキーワードを活用)から自動取得する機能を実装した。
集合知に基づく言語モデリング手法の確立への取り組みとして、まず、Webサービス「PodCastle」を通じて得られる書き起こしテキストを発話スタイルの観点から分析するとともに、こうした集合知をもとにした書き起こしテキストを集約した独自のコーパスを構築・整備した。本コーパスを活用することで、様々な発話スタイルを単一のモデル内に反映した大域的言語モデリング、さらに発話スタイル・話題に動的に適応する新たな言語モデリング手法の検討を行い、開発・評価を行った。

  • 研究成果

    (1件)

すべて その他

すべて 学会発表 (1件)

  • [学会発表] PodCastle: Collaborative Training of Language Models on the Basis of Wisdom of Crowds

    • 著者名/発表者名
      Jun Ogata, Masataka Goto
    • 学会等名
      Interspeech2012
    • 発表場所
      Portland, USA

URL: 

公開日: 2014-07-24  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi