異種音声単位と複数言語を用いた高分解能音声特徴空間の構築と応用の研究

研究課題

研究課題/領域番号	15K00262
研究種目	基盤研究(Ｃ)
配分区分	基金
応募区分	一般
研究分野	知覚情報処理
研究機関	国立研究開発法人産業技術総合研究所
研究代表者	李時旭国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (50415642)
研究分担者	伊藤慶明岩手県立大学, ソフトウェア情報学部, 教授 (90325928)
研究期間 (年度)	2015-10-21 – 2018-03-31
研究課題ステータス	完了 (2017年度)
配分額 *注記	4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円) 2017年度: 780千円 (直接経費: 600千円、間接経費: 180千円) 2016年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円) 2015年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
キーワード	音声情報処理 / パターン認識 / ヒューマンインタフェース / 時系列解析 / 統計的パターン認識 / 情報検索 / 多変量解析 / 知能情報処理 / 音声認識 / 異種音声単位 / 深層学習 / システム統合 / 音声検索語検出 / 多言語処理
研究成果の概要	本研究では、異種情報を用いて音声特徴空間上の識別能力を高めることにより音声認識の性能を向上させることを目的とする。最近の深層学習技術では、殆どの音声認識システムが単一の音声単位を基に構築されるため、膨大なデータを用いても音声の多様性を十分にはモデル化できない問題が存在する。その解決策として、従来の文脈的拡張音声単位と完全に異なる時間的拡張の音声単位である音素片を導入し、異種性の高い音声特徴空間の構築を提案する。提案した異種音声単位による高分解能音声特徴空間が従来の生成モデルから最先端の深層学習モデルまで幅広い音声認識システム上で有効であることが、実応用の音声検索語検出タスクを対象に確認できた。

報告書

(4件)

研究成果

(22件)

すべて 2018 2017 2016 2015

すべて雑誌論文 (3件) (うち査読あり 3件) 学会発表 (19件) (うち国際学会 6件、招待講演 1件)

[雑誌論文] 音声中の検索語検出におけるDeep Neural Networkの出力確率を用いたリスコアリング手法の提案2017
- 著者名/発表者名
  紺野良太、李時旭、田中和世、小嶋和徳、伊藤慶明
- 雑誌名
  
  電子情報通信学会論文誌. D, 情報・システム
  
  巻: J100-D ページ: 595-604
- 関連する報告書
  2017 実績報告書
- 査読あり
[雑誌論文] 音声中の検索語検出における同文書内の高順位候補を利用したリスコアリング方式2016
- 著者名/発表者名
  小嶋和徳, 紺野和磨, 田中和世, 李時旭, 伊藤慶明
- 雑誌名
  
  電子情報通信学会論文誌情報・システムD
  
  巻: J100-D ページ: 70-80
- 関連する報告書
  2016 実施状況報告書
- 査読あり
[雑誌論文] 音声中の未知語の検索語検出における音節バイグラムのインデックス化方式2016
- 著者名/発表者名
  伊藤慶明，鳴海司朗，大内一揮，菅原翔太，李時旭
- 雑誌名
  
  電子情報通信学会論文，D
  
  巻: J99-D ページ: 178-187
- 関連する報告書
  2015 実施状況報告書
- 査読あり
[学会発表] 音声検索語検出の距離値における事後確率の統合2018
- 著者名/発表者名
  李時旭,田中和世,伊藤慶明
- 学会等名
  日本音響学会2018年春季研究発表会
- 関連する報告書
  2017 実績報告書
[学会発表] 音声中の音声検索語検出におけるPosteriorgram照合の検索時間削減方式2018
- 著者名/発表者名
  小原真人,小嶋和徳,李時旭,伊藤慶明
- 学会等名
  日本音響学会2018年春季研究発表会
- 関連する報告書
  2017 実績報告書
[学会発表] 音声中の検索語検出における最上位候補を含む講演及びその類似講演優先方式2018
- 著者名/発表者名
  丹治遥,小嶋和徳,李時旭,南條浩輝,伊藤慶明
- 学会等名
  日本音響学会2018年春季研究発表会
- 関連する報告書
  2017 実績報告書
[学会発表] 音声検索語検出システムのスコアリングに関する実験的検討2017
- 著者名/発表者名
  李時旭, 小嶋和徳, 伊藤慶明
- 学会等名
  日本音響学会2017年春季研究発表会
- 発表場所
  神奈川県川崎市・明治大学生田キャンパス
- 年月日
  2017-03-15
- 関連する報告書
  2016 実施状況報告書
[学会発表] SQ-STDにおけるDNN及びCTC導入方式の検討2017
- 著者名/発表者名
  紺野良太, 小嶋和徳, 李時旭, 田中和世, 伊藤慶明
- 学会等名
  日本音響学会2017年春季研究発表会
- 発表場所
  神奈川県川崎市・明治大学生田キャンパス
- 年月日
  2017-03-15
- 関連する報告書
  2016 実施状況報告書
[学会発表] 音声中の検索語検出における拗音及び長母音モデルの検討2017
- 著者名/発表者名
  関恒平, 小嶋和徳, 李時旭, 田中和世, 伊藤慶明
- 学会等名
  日本音響学会2017年春季研究発表会
- 発表場所
  神奈川県川崎市・明治大学生田キャンパス
- 年月日
  2017-03-15
- 関連する報告書
  2016 実施状況報告書
[学会発表] constructing acoustic distances between subwords and states obtained from a deep neural network for spoken term detection2017
- 著者名/発表者名
  金子大祐、紺野良太、小嶋和徳、田中和世、李時旭、伊藤慶明
- 学会等名
  INTERSPEECH2017
- 関連する報告書
  2017 実績報告書
- 国際学会
[学会発表] Acceleration for Query-by-Example Using Posteriorgram of Deep Neural Network2017
- 著者名/発表者名
  小原真人,紺野良太,小嶋和徳,田中和世,李時旭,伊藤慶明
- 学会等名
  APSIPA ASC 2017
- 関連する報告書
  2017 実績報告書
- 国際学会
[学会発表] 音声中の検索語検出におけるParagraph Vectorを用いたリスコアリング手法2017
- 著者名/発表者名
  清水嘉乃,李時旭,小嶋和徳,伊藤慶明
- 学会等名
  日本音響学会2017年秋季研究発表会
- 関連する報告書
  2017 実績報告書
[学会発表] STDにおける複数検索結果のスコア優先統合方式2016
- 著者名/発表者名
  清水嘉乃, 岩崎瑛太郎, 李時旭, 田中和世, 小嶋和徳, 伊藤慶明
- 学会等名
  日本音響学会2016年秋季研究発表会
- 発表場所
  富山大学
- 年月日
  2016-09-14
- 関連する報告書
  2016 実施状況報告書
[学会発表] サブワード/状態/フレーム照合スコアの統合によるSQ-STD検索精度向上2016
- 著者名/発表者名
  紺野良太, 李時旭, 田中和世, 小嶋和徳, 伊藤慶明
- 学会等名
  日本音響学会2016年秋季研究発表会
- 発表場所
  富山大学
- 年月日
  2016-09-14
- 関連する報告書
  2016 実施状況報告書
[学会発表] Generating complementary acoustic model spaces in DNN-based sequence-to-frame DTW scheme for out-of-vocabulary spoken term detection2016
- 著者名/発表者名
  Shi-wook Lee, Kazuyo Tanaka, Yoshiaki Itoh
- 学会等名
  INTERSPEECH 2016
- 発表場所
  San Francisco, USA
- 年月日
  2016-09-08
- 関連する報告書
  2016 実施状況報告書
- 国際学会
[学会発表] RESCORING BY COMBINATION OF POSTERIORGRAM SCORE AND SUBWORD-MATCHING SCORE FOR USE IN QUERY-BY-EXAMPLE2016
- 著者名/発表者名
  Masato Obara, Kazunori Kojima, Kazuyo Tanaka, Shi-wook Lee, Yoshiaki Itoh
- 学会等名
  INTERSPEECH 2016
- 発表場所
  San Francisco, USA
- 年月日
  2016-09-08
- 関連する報告書
  2016 実施状況報告書
- 国際学会
[学会発表] DNN分布間距離より構築したサブワード /状態間音響距離のSTDへの適用2016
- 著者名/発表者名
  紺野良太，李時旭，田中和世，小嶋和徳，伊藤慶明
- 学会等名
  日本音響学会春季研究発表会
- 発表場所
  神奈川県横浜市/桐蔭横浜大学
- 年月日
  2016-03-09
- 関連する報告書
  2015 実施状況報告書
[学会発表] DNN 出力確率系列Posteriorgram との併用によるSTD 検索精度の向上2016
- 著者名/発表者名
  小原真人，李時旭，田中和世，小嶋和徳，伊藤慶明
- 学会等名
  日本音響学会春季研究発表会
- 発表場所
  神奈川県横浜市/桐蔭横浜大学
- 年月日
  2016-03-09
- 関連する報告書
  2015 実施状況報告書
[学会発表] 音声中の検索語検出の研究動向とDNNの導入事例2016
- 著者名/発表者名
  伊藤慶明, 紺野良太, 小原真人, 李時旭, 田中和世
- 学会等名
  音声研究会・音声言語情報処理研究会　合同研究会
- 発表場所
  山形県天童市
- 関連する報告書
  2016 実施状況報告書
- 招待講演
[学会発表] 音声中の検索語検出における音響距離構築方式の検討2016
- 著者名/発表者名
  紺野良太, 李時旭, 田中和世, 小嶋和徳, 伊藤慶明
- 学会等名
  音声研究会・音声言語情報処理研究会　合同研究会
- 発表場所
  山形県天童市
- 関連する報告書
  2016 実施状況報告書
[学会発表] An integration method of multiple search results for spoken term detection2016
- 著者名/発表者名
  清水嘉乃, 岩崎瑛太郎, 李時旭, 田中和世, 小嶋和徳, 伊藤慶明
- 学会等名
  5th Joint Meeting of the Acoustical Society of America and Acoustical Society of Japan
- 発表場所
  Honolulu Hawaii
- 関連する報告書
  2016 実施状況報告書
- 国際学会
[学会発表] Rescoring by a Deep Neural Network for Spoken Term Detection2015
- 著者名/発表者名
  Ryota Konno, Kazunori Kojima, Lee Shi-Wook, Kazuyo Tanaka, Yoshiaki Itoh
- 学会等名
  Asia-Pacific Signal and Information Processing Association APSIPA 2015
- 発表場所
  HONG KONG, CHINA
- 年月日
  2015-12-16
- 関連する報告書
  2015 実施状況報告書
- 国際学会

異種音声単位と複数言語を用いた高分解能音声特徴空間の構築と応用の研究

研究代表者

李 時旭 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (50415642)

4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)

報告書

研究成果

[雑誌論文] 音声中の検索語検出におけるDeep Neural Networkの出力確率を用いたリスコアリング手法の提案2017

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 音声中の検索語検出における同文書内の高順位候補を利用したリスコアリング方式2016

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 音声中の未知語の検索 語検出における 音節バイグラムのインデックス化方式2016

著者名/発表者名

雑誌名

関連する報告書

[学会発表] 音声検索語検出の距離値における事後確率の統合2018

著者名/発表者名

学会等名

関連する報告書

[学会発表] 音声中の音声検索語検出におけるPosteriorgram照合の検索時間削減方式2018

著者名/発表者名

学会等名

関連する報告書

[学会発表] 音声中の検索語検出における最上位候補を含む講演及びその類似講演優先方式2018

著者名/発表者名

学会等名

関連する報告書

[学会発表] 音声検索語検出システムのスコアリングに関する実験的検討2017

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] SQ-STDにおけるDNN及びCTC導入方式の検討2017

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 音声中の検索語検出における拗音及び長母音モデルの検討2017

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] constructing acoustic distances between subwords and states obtained from a deep neural network for spoken term detection2017

著者名/発表者名

学会等名

関連する報告書

[学会発表] Acceleration for Query-by-Example Using Posteriorgram of Deep Neural Network2017

著者名/発表者名

学会等名

関連する報告書

[学会発表] 音声中の検索語検出におけるParagraph Vectorを用いたリスコアリング手法2017

著者名/発表者名

学会等名

関連する報告書

[学会発表] STDにおける複数検索結果のスコア優先統合方式2016

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] サブワード/状態/フレーム照合スコアの統合によるSQ-STD検索精度向上2016

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Generating complementary acoustic model spaces in DNN-based sequence-to-frame DTW scheme for out-of-vocabulary spoken term detection2016

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] RESCORING BY COMBINATION OF POSTERIORGRAM SCORE AND SUBWORD-MATCHING SCORE FOR USE IN QUERY-BY-EXAMPLE2016

著者名/発表者名

李時旭国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (50415642)

[雑誌論文] 音声中の未知語の検索語検出における音節バイグラムのインデックス化方式2016

[学会発表] DNN 出力確率系列Posteriorgram との併用によるSTD 検索精度の向上2016