2017 Fiscal Year Annual Research Report

Spoken term detection system with high retrieval accuracy, high speed and small resources using Deep Neural Network

Research Project

Project/Area Number	15K00241
Research Institution	Iwate Prefectural University
Principal Investigator	伊藤慶明岩手県立大学, ソフトウェア情報学部, 教授 (90325928)
Co-Investigator(Kenkyū-buntansha)	李時旭国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (50415642)
Project Period (FY)	2015-04-01 – 2018-03-31
Keywords	音声中の検索語検出 / 深層学習 / Deep Neural Network
Outline of Annual Research Achievements	近年、大量のビデオや大量の音声データが蓄積され、その中からユーザが所望する区間を簡便に検索する機能が望まれている。本研究では、ビデオや音声データ中の音声に対して、検索したい単語や句（検索語）を「テキスト」あるいは「音声」で与え、高精度・高速・低資源で検索を実現するシステムを目指すものである。検索語が音声認識システムの辞書に含まれていない「未知語」の場合には検索が困難である。検索語は未知語になることが多く未知語の検索機能は必要不可欠である。本研究では未知語検索の高精度化、高速化、低資源化を目的として、平成27年度は主に、DNN(Deep Neural Network)を本研究テーマのために導入し、新しい検索方式の実現と高精度化についての研究開発を実施した。しかし、DNNを用いると計算時間を要するため、平成28年度は以下の研究開発を実施した、第1段階で従来手法を用いて有力な候補を抽出し、第2段階でその少数の有力候補に対してのみDNNを用いた詳細照合を行う方式を研究開発し、計算時間の削減を実現した。また事前に音節バイグラムで検索する方式を開発し、さらなる高速化・低資源化を実現した。平成28年度から継続して平成29年度は、検索語が音声で与えられ際の高精度、高速、低資源の検索システムの研究開発を推進した。検索語の音声の特徴量系列と音声データの特徴量系列との照合を行う際に、これまでメモリ上には載らない大量のデータ量が必要となり長時間の照合時間を要していたが、ビット列照合/スパースベクトル照合技術を導入し、メモリ上での検索方式を研究開発し検索の高速化を実現した。さらにフレームレベルの事後確率全体を各フレームの１位の確率に置き換えることにより高速かつ低資源で照合を実現する方式を研究開発し、本研究成果については2018年の国際会議INTERSPEECHおよびAPSIPA等で研究発表を行った。

Research Products
(9 results)

All 2018 2017

All Journal Article (2 results) (of which Peer Reviewed: 2 results, Open Access: 2 results) Presentation (7 results) (of which Int'l Joint Research: 2 results)

[Journal Article] 音声中の検索語検出におけるDeep Neural Networkの出力確率を用いたリスコアリング手法の提案2017
- Author(s)
  紺野良太，小嶋和徳，李時旭，伊藤慶明
- Journal Title
  
  電子情報通信学会論文
  
  Volume: Vol.J100-D, No5 Pages: 595-604
- DOI
  10.14923/transinfj.2016JDP7103
- Peer Reviewed / Open Access
[Journal Article] 音声中の検索語検出におけるDeep Neural Networkの出力確率を用いた音響距離構築方式2017
- Author(s)
  紺野良太，小嶋和徳，李時旭，伊藤慶明
- Journal Title
  
  電子情報通信学会論文
  
  Volume: Vol.J100-D,No.8 Pages: 798-807
- DOI
  10.14923/transinfj.2016JDP7122
- Peer Reviewed / Open Access
[Presentation] 音声中の検索語検出における深層学習を用いた検索時間削減方式2018
- Author(s)
  小原真人，小嶋和徳，伊藤慶明，田中和世，李時旭
- Organizer
  日本音響学会春季研究発表会
[Presentation] 音声中の検索語検出における最上位候補を含む講演及びその類似講演優先方式2018
- Author(s)
  丹治遥，小嶋和徳，李時旭，南條浩輝，伊藤慶明
- Organizer
  日本音響学会春季研究発表会
[Presentation] 音声中の検索語検出におけるドキュメント間類似度を利用したリスコアリング方式2018
- Author(s)
  清水嘉乃，李時旭，小嶋和徳，伊藤慶明
- Organizer
  情報処理学会第80回全国大会
[Presentation] 音声検索語検出の距離値における事後確率の統合2018
- Author(s)
  李時旭，田中和世，伊藤慶明
- Organizer
  日本音響学会春季研究発表会
[Presentation] Constructing Acoustic Distances between Subwords and States Obtained from a Deep Neural Network for Spoken Term Detection2017
- Author(s)
  Daisuke Kaneko, Kazunori Kojima, Kazuyo Tanaka, Shi-wook Lee, Yoshiaki Itoh
- Organizer
  INTERSPEECH
- Int'l Joint Research
[Presentation] Acceleration for Query-by-Example Using Posteriorgram of Deep Neural Network2017
- Author(s)
  Masato Obara, Kazunori Kojima, Shi-wook Lee and Yoshiaki Itoh
- Organizer
  Asia-Pacific Signal and Information Processing Association APSIPA
- Int'l Joint Research
[Presentation] 音声中の検索語検出におけるParagraph Vector を用いたリスコアリング手法2017
- Author(s)
  清水嘉乃，李時旭，小嶋和徳，伊藤慶明
- Organizer
  日本音響学会秋季研究発表会

2017 Fiscal Year Annual Research Report

Spoken term detection system with high retrieval accuracy, high speed and small resources using Deep Neural Network

Principal Investigator

伊藤 慶明 岩手県立大学, ソフトウェア情報学部, 教授 (90325928)

Research Products

[Journal Article] 音声中の検索語検出におけるDeep Neural Networkの出力確率を用いたリスコアリング手法の提案2017

Author(s)

Journal Title

DOI

[Journal Article] 音声中の検索語検出におけるDeep Neural Networkの出力確率を用いた音響距離構築方式2017

Author(s)

Journal Title

DOI

[Presentation] 音声中の検索語検出における深層学習を用いた検索時間削減方式2018

Author(s)

Organizer

[Presentation] 音声中の検索語検出における最上位候補を含む講演及びその類似講演優先方式2018

Author(s)

Organizer

[Presentation] 音声中の検索語検出におけるドキュメント間類似度を利用したリスコアリング方式2018

Author(s)

Organizer

[Presentation] 音声検索語検出の距離値における事後確率の統合2018

Author(s)

Organizer

[Presentation] Constructing Acoustic Distances between Subwords and States Obtained from a Deep Neural Network for Spoken Term Detection2017

Author(s)

Organizer

[Presentation] Acceleration for Query-by-Example Using Posteriorgram of Deep Neural Network2017

Author(s)

Organizer

[Presentation] 音声中の検索語検出におけるParagraph Vector を用いたリスコアリング手法2017

Author(s)

Organizer

伊藤慶明岩手県立大学, ソフトウェア情報学部, 教授 (90325928)