研究課題/領域番号 |
25330128
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
マルチメディア・データベース
|
研究機関 | 静岡大学 |
研究代表者 |
甲斐 充彦 静岡大学, 工学部, 准教授 (60283496)
|
研究分担者 |
王 龍標 長岡技術科学大学, 技学研究院, 准教授 (30510458)
|
連携研究者 |
小暮 悟 静岡大学, 情報学部, 講師 (40359758)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
研究課題ステータス |
完了 (2015年度)
|
配分額 *注記 |
4,940千円 (直接経費: 3,800千円、間接経費: 1,140千円)
2015年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2014年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2013年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
|
キーワード | 音声ドキュメント検索 / 音声検索語検出 / STD / 音声クエリ / DNN / 音声認識信頼度 / スコア正規化 / 音声区間検出 / 雑音残響環境 / 残響除去 / 認識精度推定 / VAD / 話者認識 / 信頼度 |
研究成果の概要 |
音声ドキュメント検索システムの開発を目的として、インデキシングや検索精度の改善に関わる要素技術の開発を進めた。音声コンテンツに含まれる多様な収録環境や話者の違いを考慮するために、近年のパターン認識分野で高い精度を示している深層ニューラルネットワークモデル(DNN)を用いて音声区間検出モデルや残響除去モデルを構築し、話者区間分類や音声認識の前処理として用いる方法を提案し、性能を改善した。また、音声ドキュメント検索の性能に大きく影響を与える自動音声認識システムの未知語に起因する検出漏れを軽減するため、DNNによる音声特徴量変換に基づく再照合手法を提案し、検索性能を改善した。
|