2012 年度実績報告書

大規模音声ドキュメントを対象とする超高速検索エンジンの構築

研究課題

研究課題/領域番号	22300060
研究機関	早稲田大学
研究代表者	新田恒雄早稲田大学, グリーンコンピューティングシステム研究機構, 教授 (70314101)
研究期間 (年度)	2010-04-01 – 2013-03-31
キーワード	音声ドキュメント検索 / 大規模音声ドキュメント / 高速検索 / 高精度音素認識 / 調音特徴
研究概要	音声-音素変換精度改良と音声ドキュメント高速検索システム評価を行った。 (1)音声－音素高精度変換器の開発では，未知語に対する検索性能を保証するため，調音特徴ベースのサブワード音声認識エンジンを開発した。(a)では，高精度調音特徴抽出器(2段のMLNから構成)の組み込み，(b)では調音運動ベース音素認識HMMの最適設計（状態数，コンテキスト，IPによる湧出し制御他），(c)では約1,200種の日本語全短・長音節に対する言語モデル(tri-gram)の組み込みに注力した。また，抽出器に音素毎の固有ベクトルを反映した部分空間を組込む方式を評価し性能向上を確認した。調音特徴入力に最適化したHMM音響モデルを開発し，実時間音素認識エンジンを開発した。 (2) キーワード高速検索システムの構築では，放送大学の講義ビデオを対象に，講義毎に設定したキーワードを検索するシステムを構築し評価した。評価では，講義音声から人手で書き下したデータを作成し，任意キーワードを1秒以内の実時間で高精度(目標F値0.7)に検索可能なことを確認した。
現在までの達成度 (区分)	理由 25年度が最終年度であるため、記入しない。
今後の研究の推進方策	25年度が最終年度であるため、記入しない。

研究成果
(6件)

すべて 2013

すべて雑誌論文 (2件) (うち査読あり 2件) 学会発表 (4件)

[雑誌論文] Suffix Arrayを用いた高速音声検索語検出システムの性能評価2013
- 著者名/発表者名
  桂田浩一，勝浦広大，入部百合絵，新田恒雄
- 雑誌名
  
  電子情報通信学会論文誌
  
  巻: Vol.J96-D，No.10 ページ: 2540-2548
- 査読あり
[雑誌論文] 調音特徴―声道音響パラメータ変換を用いた調音特徴運動HMM音声合成2013
- 著者名/発表者名
  木村優志，入部百合絵，桂田浩一，新田恒雄
- 雑誌名
  
  電子情報通信学会論文誌
  
  巻: Vol.J96-D，No.5 ページ: 1356-1364
- 査読あり
[学会発表] Acceleration of Spoken Term Detection Using a Suffix Array by Assigning Optimal Threshold Values to Sub-Keywords2013
- 著者名/発表者名
  Kouichi Katsurada, Seiichi Miura, Kheang Seng, Yurie Iribe and Tsuneo Nitta
- 学会等名
  Proc. of InterSpeech 2013, pp.11-14 (2013-8).
- 発表場所
  Lyon, France
- 年月日
  20130825-20130829
[学会発表] Introducing Articulatory Ancho-point to ANN Training for Corrective Learning of Pronunciation2013
- 著者名/発表者名
  Yurie Iribe, Silasak Manosavanh, Kouichi Katsurada, Ryoko Hayashi, Chunyue Zhu, and Tsuneo Nitta
- 学会等名
  Proc of. ICASSP2013
- 発表場所
  Vancouver, Canada
- 年月日
  20130526-20130531
[学会発表] 双対空間における調音特徴抽出の検討2013
- 著者名/発表者名
  佐々木俊，入部百合絵，桂田浩一，新田恒雄
- 学会等名
  日本音響学会2013年春季研究発表会
- 発表場所
  東京工科大学
- 年月日
  20130313-20130315
[学会発表] 調音運動音響モデルと長短音節言語モデルを用いた音素認識エンジン2013
- 著者名/発表者名
  遠藤基，入部百合絵，桂田浩一，新田恒雄
- 学会等名
  日本音響学会2013年春季研究発表会
- 発表場所
  東京工科大学
- 年月日
  20130313-20130315

2012 年度 実績報告書

大規模音声ドキュメントを対象とする超高速検索エンジンの構築

研究代表者

新田 恒雄 早稲田大学, グリーンコンピューティングシステム研究機構, 教授 (70314101)

理由

研究成果

[雑誌論文] Suffix Arrayを用いた高速音声検索語検出システムの性能評価2013

著者名/発表者名

雑誌名

[雑誌論文] 調音特徴―声道音響パラメータ変換を用いた調音特徴運動HMM音声合成2013

著者名/発表者名

雑誌名

[学会発表] Acceleration of Spoken Term Detection Using a Suffix Array by Assigning Optimal Threshold Values to Sub-Keywords2013

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Introducing Articulatory Ancho-point to ANN Training for Corrective Learning of Pronunciation2013

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 双対空間における調音特徴抽出の検討2013

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 調音運動音響モデルと長短音節言語モデルを用いた音素認識エンジン2013

著者名/発表者名

学会等名

発表場所

年月日

2012 年度実績報告書

新田恒雄早稲田大学, グリーンコンピューティングシステム研究機構, 教授 (70314101)