研究課題/領域番号 |
15K00262
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
知覚情報処理
|
研究機関 | 国立研究開発法人産業技術総合研究所 |
研究代表者 |
李 時旭 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (50415642)
|
研究分担者 |
伊藤 慶明 岩手県立大学, ソフトウェア情報学部, 教授 (90325928)
|
研究期間 (年度) |
2015-10-21 – 2018-03-31
|
研究課題ステータス |
完了 (2017年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2017年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2016年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2015年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
|
キーワード | 音声情報処理 / パターン認識 / ヒューマンインタフェース / 時系列解析 / 統計的パターン認識 / 情報検索 / 多変量解析 / 知能情報処理 / 音声認識 / 異種音声単位 / 深層学習 / システム統合 / 音声検索語検出 / 多言語処理 |
研究成果の概要 |
本研究では、異種情報を用いて音声特徴空間上の識別能力を高めることにより音声認識の性能を向上させることを目的とする。 最近の深層学習技術では、殆どの音声認識システムが単一の音声単位を基に構築されるため、膨大なデータを用いても音声の多様性を十分にはモデル化できない問題が存在する。その解決策として、従来の文脈的拡張音声単位と完全に異なる時間的拡張の音声単位である音素片を導入し、異種性の高い音声特徴空間の構築を提案する。 提案した異種音声単位による高分解能音声特徴空間が従来の生成モデルから最先端の深層学習モデルまで幅広い音声認識システム上で有効であることが、実応用の音声検索語検出タスクを対象に確認できた。
|