• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 研究成果報告書

異種音声単位と複数言語を用いた高分解能音声特徴空間の構築と応用の研究

研究課題

  • PDF
研究課題/領域番号 15K00262
研究種目

基盤研究(C)

配分区分基金
応募区分一般
研究分野 知覚情報処理
研究機関国立研究開発法人産業技術総合研究所

研究代表者

李 時旭  国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (50415642)

研究分担者 伊藤 慶明  岩手県立大学, ソフトウェア情報学部, 教授 (90325928)
研究期間 (年度) 2015-10-21 – 2018-03-31
キーワード音声情報処理 / パターン認識 / ヒューマンインタフェース / 時系列解析 / 統計的パターン認識 / 情報検索 / 多変量解析 / 知能情報処理
研究成果の概要

本研究では、異種情報を用いて音声特徴空間上の識別能力を高めることにより音声認識の性能を向上させることを目的とする。
最近の深層学習技術では、殆どの音声認識システムが単一の音声単位を基に構築されるため、膨大なデータを用いても音声の多様性を十分にはモデル化できない問題が存在する。その解決策として、従来の文脈的拡張音声単位と完全に異なる時間的拡張の音声単位である音素片を導入し、異種性の高い音声特徴空間の構築を提案する。
提案した異種音声単位による高分解能音声特徴空間が従来の生成モデルから最先端の深層学習モデルまで幅広い音声認識システム上で有効であることが、実応用の音声検索語検出タスクを対象に確認できた。

自由記述の分野

情報学

URL: 

公開日: 2019-03-29  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi