2017 年度実績報告書

DNNを用いた音声による音声の検索の高精度・高速・低資源システムの実現

研究課題

研究課題/領域番号	15K00241
研究機関	岩手県立大学
研究代表者	伊藤慶明岩手県立大学, ソフトウェア情報学部, 教授 (90325928)
研究分担者	李時旭国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (50415642)
研究期間 (年度)	2015-04-01 – 2018-03-31
キーワード	音声中の検索語検出 / 深層学習 / Deep Neural Network
研究実績の概要	近年、大量のビデオや大量の音声データが蓄積され、その中からユーザが所望する区間を簡便に検索する機能が望まれている。本研究では、ビデオや音声データ中の音声に対して、検索したい単語や句（検索語）を「テキスト」あるいは「音声」で与え、高精度・高速・低資源で検索を実現するシステムを目指すものである。検索語が音声認識システムの辞書に含まれていない「未知語」の場合には検索が困難である。検索語は未知語になることが多く未知語の検索機能は必要不可欠である。本研究では未知語検索の高精度化、高速化、低資源化を目的として、平成27年度は主に、DNN(Deep Neural Network)を本研究テーマのために導入し、新しい検索方式の実現と高精度化についての研究開発を実施した。しかし、DNNを用いると計算時間を要するため、平成28年度は以下の研究開発を実施した、第1段階で従来手法を用いて有力な候補を抽出し、第2段階でその少数の有力候補に対してのみDNNを用いた詳細照合を行う方式を研究開発し、計算時間の削減を実現した。また事前に音節バイグラムで検索する方式を開発し、さらなる高速化・低資源化を実現した。平成28年度から継続して平成29年度は、検索語が音声で与えられ際の高精度、高速、低資源の検索システムの研究開発を推進した。検索語の音声の特徴量系列と音声データの特徴量系列との照合を行う際に、これまでメモリ上には載らない大量のデータ量が必要となり長時間の照合時間を要していたが、ビット列照合/スパースベクトル照合技術を導入し、メモリ上での検索方式を研究開発し検索の高速化を実現した。さらにフレームレベルの事後確率全体を各フレームの１位の確率に置き換えることにより高速かつ低資源で照合を実現する方式を研究開発し、本研究成果については2018年の国際会議INTERSPEECHおよびAPSIPA等で研究発表を行った。

研究成果
(9件)

すべて 2018 2017

すべて雑誌論文 (2件) (うち査読あり 2件、オープンアクセス 2件) 学会発表 (7件) (うち国際学会 2件)

[雑誌論文] 音声中の検索語検出におけるDeep Neural Networkの出力確率を用いたリスコアリング手法の提案2017
- 著者名/発表者名
  紺野良太，小嶋和徳，李時旭，伊藤慶明
- 雑誌名
  
  電子情報通信学会論文
  
  巻: Vol.J100-D, No5 ページ: 595-604
- DOI
  10.14923/transinfj.2016JDP7103
- 査読あり / オープンアクセス
[雑誌論文] 音声中の検索語検出におけるDeep Neural Networkの出力確率を用いた音響距離構築方式2017
- 著者名/発表者名
  紺野良太，小嶋和徳，李時旭，伊藤慶明
- 雑誌名
  
  電子情報通信学会論文
  
  巻: Vol.J100-D,No.8 ページ: 798-807
- DOI
  10.14923/transinfj.2016JDP7122
- 査読あり / オープンアクセス
[学会発表] 音声中の検索語検出における深層学習を用いた検索時間削減方式2018
- 著者名/発表者名
  小原真人，小嶋和徳，伊藤慶明，田中和世，李時旭
- 学会等名
  日本音響学会春季研究発表会
[学会発表] 音声中の検索語検出における最上位候補を含む講演及びその類似講演優先方式2018
- 著者名/発表者名
  丹治遥，小嶋和徳，李時旭，南條浩輝，伊藤慶明
- 学会等名
  日本音響学会春季研究発表会
[学会発表] 音声中の検索語検出におけるドキュメント間類似度を利用したリスコアリング方式2018
- 著者名/発表者名
  清水嘉乃，李時旭，小嶋和徳，伊藤慶明
- 学会等名
  情報処理学会第80回全国大会
[学会発表] 音声検索語検出の距離値における事後確率の統合2018
- 著者名/発表者名
  李時旭，田中和世，伊藤慶明
- 学会等名
  日本音響学会春季研究発表会
[学会発表] Constructing Acoustic Distances between Subwords and States Obtained from a Deep Neural Network for Spoken Term Detection2017
- 著者名/発表者名
  Daisuke Kaneko, Kazunori Kojima, Kazuyo Tanaka, Shi-wook Lee, Yoshiaki Itoh
- 学会等名
  INTERSPEECH
- 国際学会
[学会発表] Acceleration for Query-by-Example Using Posteriorgram of Deep Neural Network2017
- 著者名/発表者名
  Masato Obara, Kazunori Kojima, Shi-wook Lee and Yoshiaki Itoh
- 学会等名
  Asia-Pacific Signal and Information Processing Association APSIPA
- 国際学会
[学会発表] 音声中の検索語検出におけるParagraph Vector を用いたリスコアリング手法2017
- 著者名/発表者名
  清水嘉乃，李時旭，小嶋和徳，伊藤慶明
- 学会等名
  日本音響学会秋季研究発表会

2017 年度 実績報告書

DNNを用いた音声による音声の検索の高精度・高速・低資源システムの実現

研究代表者

伊藤 慶明 岩手県立大学, ソフトウェア情報学部, 教授 (90325928)

研究成果

[雑誌論文] 音声中の検索語検出におけるDeep Neural Networkの出力確率を用いたリスコアリング手法の提案2017

著者名/発表者名

雑誌名

DOI

[雑誌論文] 音声中の検索語検出におけるDeep Neural Networkの出力確率を用いた音響距離構築方式2017

著者名/発表者名

雑誌名

DOI

[学会発表] 音声中の検索語検出における深層学習を用いた検索時間削減方式2018

著者名/発表者名

学会等名

[学会発表] 音声中の検索語検出における最上位候補を含む講演及びその類似講演優先方式2018

著者名/発表者名

学会等名

[学会発表] 音声中の検索語検出におけるドキュメント間類似度を利用したリスコアリング方式2018

著者名/発表者名

学会等名

[学会発表] 音声検索語検出の距離値における事後確率の統合2018

著者名/発表者名

学会等名

[学会発表] Constructing Acoustic Distances between Subwords and States Obtained from a Deep Neural Network for Spoken Term Detection2017

著者名/発表者名

学会等名

[学会発表] Acceleration for Query-by-Example Using Posteriorgram of Deep Neural Network2017

著者名/発表者名

学会等名

[学会発表] 音声中の検索語検出におけるParagraph Vector を用いたリスコアリング手法2017

著者名/発表者名

学会等名

2017 年度実績報告書

伊藤慶明岩手県立大学, ソフトウェア情報学部, 教授 (90325928)