2014 年度実績報告書

Ｓｕｆｆｉｘ　Ａｒｒａｙを用いた音声検索における高速アルゴリズムの研究とその検証

研究課題

研究課題/領域番号	24700167
研究機関	豊橋技術科学大学
研究代表者	桂田浩一豊橋技術科学大学, 国際交流センター, 准教授 (80324490)
研究期間 (年度)	2012-04-01 – 2015-03-31
キーワード	音声検索語検出 / Suffix Array / キーワード分割
研究実績の概要	本研究ではSuffix Arrayを用いた高速な音声検索システムにおいて，高速化のために導入しているキーワード分割に関して，最適な検索閾値を分割キーワードに与えるための理論的枠組みを検討した．従来の方法ではキーワードを分割した際に各分割キーワードに同じ検索閾値を与えていたが，分割キーワードによっては検索結果が多くなり，多大な検索時間が必要となる場合があった．これに対して本研究では分割キーワードに与える検索閾値を調整することにより，全ての分割キーワードを検索する時間の合計を最小化することを目指した．このために，本研究では検索時間の増加傾向を回帰分析によってモデル化し，合計の検索時間が最小になるよう検索閾値をモデルに基づいて解析的に求める方法を採った．この手法の有効性を検証するためにCSJコーパス（606時間）を対象に，NTCIR-9 SpokenDocテストコレクションのSTD(Spoken Term Detection)ALLタスク用キーワード50個のうち分割検索を行う長いキーワード（10音素から18音素）30個を検索したところ，検索時間を7.0%～34.0%削減することができた．また，検索システムの開発については放送大学と共同開発を行うことで，サーバ・クライアント型およびスタンドアローン型のプロトタイプシステムを完成させた．放送大学で実施された20講義の音声データを用いた検索システムの評価を行ったところ，平均の最大F値が0.66であるとの結果が得られた．本研究と別途実施した市場調査ではF値が0.7程度であれば実用性があるとの結果が得られており，あと僅かな性能の向上で実用化に到達できる性能であることが確認された．

研究成果
(7件)

すべて 2015 2014

すべて雑誌論文 (2件) (うち査読あり 2件、謝辞記載あり 2件) 学会発表 (5件)

[雑誌論文] Solving the phoneme conflict in Grapheme-To-Phoneme Conversion using a Two-Stage Neural Network-based approach2014
- 著者名/発表者名
  Seng Kheang, Kouichi Katsurada, Yurie Iribe and Tsuneo Nitta
- 雑誌名
  
  IEICE Transaction on Information and System
  
  巻: E97-D ページ: 901-910
- DOI
  10.1587/transinf.E97.D.901
- 査読あり / 謝辞記載あり
[雑誌論文] Mapping Articulatory Features to Vocal-Tract Parameters for Voice Conversion2014
- 著者名/発表者名
  Narpendyah W. Ariwardhani, Yurie Iribe, Kouichi Katsurada and Tsuneo Nitta
- 雑誌名
  
  IEICE Transaction on Information and System
  
  巻: E97-D ページ: 911-918
- DOI
  10.1587/transinf.E97.D.911
- 査読あり / 謝辞記載あり
[学会発表] AutoEncoderを用いたActive Appearance Modelsの性能向上2015
- 著者名/発表者名
  渡辺拓也，桂田浩一，新田恒雄，入部百合絵
- 学会等名
  情報処理学会第77回全国大会
- 発表場所
  京都大学
- 年月日
  2015-03-17 – 2015-03-19
[学会発表] 調音運動に基づく HMM 歌声合成における予測残差音源の自然性向上2015
- 著者名/発表者名
  入澤浩太郎，桂田浩一，入部百合絵，新田恒雄
- 学会等名
  日本音響学会2015春季研究発表会講演論文集
- 発表場所
  中央大学後楽園キャンパス
- 年月日
  2015-03-16 – 2015-03-18
[学会発表] 調音運動に基づくHMM歌声合成における駆動音源の改善2015
- 著者名/発表者名
  入澤浩太郎，桂田浩一，入部百合絵,新田恒雄
- 学会等名
  電子情報通信学会技術研究報告，SP2014-127
- 発表場所
  じゅうろくプラザ
- 年月日
  2015-01-22
[学会発表] Novel Two-Stage Model for Grapheme-to-Phoneme Conversion using New Grapheme Generation Rules2014
- 著者名/発表者名
  Seng Kheang, Kouichi Katsurada, Yurie Iribe and Tsuneo Nitta
- 学会等名
  ICAICTA2014
- 発表場所
  インドネシア・バンドン
- 年月日
  2014-08-20 – 2014-08-21
[学会発表] 認識に使用する顔領域の違いによる読唇性能の比較2014
- 著者名/発表者名
  桂田浩一
- 学会等名
  第1回サイレント音声認識ワークショップ
- 発表場所
  九州工業大学
- 年月日
  2014-08-07 – 2014-08-08

2014 年度 実績報告書

Ｓｕｆｆｉｘ Ａｒｒａｙを用いた音声検索における高速アルゴリズムの研究とその検証

研究代表者

桂田 浩一 豊橋技術科学大学, 国際交流センター, 准教授 (80324490)

研究成果

[雑誌論文] Solving the phoneme conflict in Grapheme-To-Phoneme Conversion using a Two-Stage Neural Network-based approach2014

著者名/発表者名

雑誌名

DOI

[雑誌論文] Mapping Articulatory Features to Vocal-Tract Parameters for Voice Conversion2014

著者名/発表者名

雑誌名

DOI

[学会発表] AutoEncoderを用いたActive Appearance Modelsの性能向上2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 調音運動に基づく HMM 歌声合成における予測残差音源の自然性向上2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 調音運動に基づくHMM歌声合成における駆動音源の改善2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Novel Two-Stage Model for Grapheme-to-Phoneme Conversion using New Grapheme Generation Rules2014

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 認識に使用する顔領域の違いによる読唇性能の比較2014

著者名/発表者名

学会等名

発表場所

年月日

2014 年度実績報告書

Ｓｕｆｆｉｘ　Ａｒｒａｙを用いた音声検索における高速アルゴリズムの研究とその検証

桂田浩一豊橋技術科学大学, 国際交流センター, 准教授 (80324490)