2010 年度実績報告書

大規模音声ドキュメントを対象とする超高速検索エンジンの構築

研究課題

研究課題/領域番号	22300060
研究機関	豊橋技術科学大学
研究代表者	新田恒雄豊橋技術科学大学, 大学院・工学研究科, 教授 (70314101)
研究分担者	桂田浩一豊橋技術科学大学, 国際交流センター, 講師 (80324490) 入部百合絵豊橋技術科学大学, 情報メディア基盤センター, 助教 (40397500)
キーワード	音声ドキュメント検索 / 高速検索 / サフィックスアレー / 音素認識 / 調音特徴 / キーワード分割
研究概要	平成22年度は,音声検索エンジンの基本性能(音声-音素変換,高速検索)の向上に注力した。 (1)音声-音素変換器の開発では,未知語に対する検索性能を保証するため,調音特徴ベースの高精度サブワード(約1,000種の音節)音声認識エンジン開発を目指している。本年度は,言語モデル(LM)なしで音素認識率88%(音素正解精度78%)の性能を得た。音響モデル(AM)に,調音特徴系列を表現する5状態triphone HMMを使用することで,湧出しの少ない音素識別が可能になった。今後サブワードLMと組合せ,目標の90%(80%)を越える性能を目指す。また,頑健性の確保についても評価・改良を行う。 (2)高速検索では,キーワード長が増えると探索領域が指数爆発を起こす問題を解決するため,キーワードを分割する手法を検討し実験から評価した。この結果,キーワードを分割する際に,各クエリ中の音素数を6～8個とし,余りが最小となる分割を採択することで,最も高速な結果が得られることが明らかとなった。今後,等分割以外の比較,他のパラメータに関する比較評価を行う。現在,プロトタイプシステムとしては,1,000時間以下の小規模音声ドキュメントを対象としたシステムが動作している。今後,大規模音声ドキュメントを対象にシステム検証できるよう,国内において音声・映像ドキュメントを大量に収蔵する機関と話し合いを行っており,H23年度には大規模音声ドキュメントに対する検証実験を行いたい。

研究成果
(12件)

すべて 2011 2010

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (11件)

[雑誌論文] Web-Based Lecture System Using Slide Sharing for Classroom Questions and Answers2010
- 著者名/発表者名
  Yurie Iribe, Hiroaki Nagaoka, Kouichi Katsurada, Tsuneo Nitta
- 雑誌名
  
  International Journal of Knowledge and Web Intelligence
  
  巻: Vol.1 ページ: 243-255
- 査読あり
[学会発表] 音声ドキュメント高速検索におけるクエリ分割とマッチング手法の比較検討2011
- 著者名/発表者名
  澤田心太, 桂田浩一, 入部百合絵, 新田恒雄
- 学会等名
  日本音響学会2011年春季研究発表会
- 発表場所
  早稲田大学
- 年月日
  2011-03-11
[学会発表] 調音運動HMMによる少量音声サンプルからの音声合成2011
- 著者名/発表者名
  小野田高幸, 入部百合絵, 桂田浩一, 新田恒雄
- 学会等名
  日本音響学会2011年春季研究発表会
- 発表場所
  早稲田大学
- 年月日
  2011-03-11
[学会発表] 調音特徴を用いた解モデルに基づくVAD2011
- 著者名/発表者名
  佐々木俊, 木村優志, 入部百合絵, 桂田浩一, 新田恒雄
- 学会等名
  日本音響学会2011年春季研究発表会
- 発表場所
  早稲田大学
- 年月日
  2011-03-09
[学会発表] 調音運動HMMに基づく高精度音素認識の検討2011
- 著者名/発表者名
  荒木厚太, 小野田高幸, 桂田浩一, 新田恒雄
- 学会等名
  日本音響会2011年春季研究発表会
- 発表場所
  早稲田大学
- 年月日
  2011-03-09
[学会発表] 高速音声ドキュメント検索における検索クエリ分割手法およびマッチング手法の比較評価2011
- 著者名/発表者名
  澤田心太, 桂田浩一, 入部百合絵, 新田恒雄
- 学会等名
  第5回音声ドキュメント処理ワークショップ
- 発表場所
  豊橋技術科学大学
- 年月日
  2011-03-07
[学会発表] One-Model Speech Recognition and Synthesis Based on Articulatory Movement HMMs2011
- 著者名/発表者名
  Masashi Kimura, Takayuki Onoda, Yurie Iribe, Kouichi Katsurada, Tsuneo Nitta
- 学会等名
  NCSP2011
- 発表場所
  天津
- 年月日
  2011-03-03
[学会発表] One-Model Speech Recognition and Synthesis Based on Articulatory Movement HMMs2010
- 著者名/発表者名
  Tsuneo Nitta, Takayuki Onoda, Masashi Kimura, Yurie Iribe, Kouichi Katsurada
- 学会等名
  INTERSPEECH2010
- 発表場所
  幕張メッセ
- 年月日
  2010-09-30
[学会発表] 調音特徴に基づく非母語話者の英語発音評価2010
- 著者名/発表者名
  森拓郎, 入部百合絵, 桂田浩一, 新田恒雄
- 学会等名
  日本音響学会2010年秋季研究発表会
- 発表場所
  関西大学
- 年月日
  2010-09-16
[学会発表] 調音運動HMM音声合成における調音と音源の改良2010
- 著者名/発表者名
  小野田高幸, 桂田浩一, 新田恒雄
- 学会等名
  日本音響学会2010年秋季研究発表会
- 発表場所
  関西大学
- 年月日
  2010-09-15
[学会発表] 大規模音声ドキュメントからの高速キーワード検索法の提案とその評価2010
- 著者名/発表者名
  澤田心太, 桂田浩一, 新田恒雄, 入部百合絵, 手島茂樹
- 学会等名
  日本音響学会2010年秋季研究発表会
- 発表場所
  関西大学
- 年月日
  2010-09-15
[学会発表] 調音運動に基づくワンモデル音声認識合成へのCELP適用2010
- 著者名/発表者名
  木村優志, 小野田高幸, 入部百合絵, 桂田浩一, 新田恒雄
- 学会等名
  2010年度人工知能学会全国大会
- 発表場所
  長崎ブリックホール
- 年月日
  2010-06-09

2010 年度 実績報告書

大規模音声ドキュメントを対象とする超高速検索エンジンの構築

研究代表者

新田 恒雄 豊橋技術科学大学, 大学院・工学研究科, 教授 (70314101)

研究成果

[雑誌論文] Web-Based Lecture System Using Slide Sharing for Classroom Questions and Answers2010

著者名/発表者名

雑誌名

[学会発表] 音声ドキュメント高速検索におけるクエリ分割とマッチング手法の比較検討2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 調音運動HMMによる少量音声サンプルからの音声合成2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 調音特徴を用いた解モデルに基づくVAD2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 調音運動HMMに基づく高精度音素認識の検討2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 高速音声ドキュメント検索における検索クエリ分割手法およびマッチング手法の比較評価2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] One-Model Speech Recognition and Synthesis Based on Articulatory Movement HMMs2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] One-Model Speech Recognition and Synthesis Based on Articulatory Movement HMMs2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 調音特徴に基づく非母語話者の英語発音評価2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 調音運動HMM音声合成における調音と音源の改良2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 大規模音声ドキュメントからの高速キーワード検索法の提案とその評価2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 調音運動に基づくワンモデル音声認識合成へのCELP適用2010

著者名/発表者名

学会等名

発表場所

年月日

2010 年度実績報告書

新田恒雄豊橋技術科学大学, 大学院・工学研究科, 教授 (70314101)