2010 年度研究成果報告書

長・短期間の音声変動の解明および音声変動に頑健な音声認識手法に関する研究

研究課題

研究課題/領域番号	19700172
研究種目	若手研究(B)
配分区分	補助金
研究分野	知覚情報処理・知能ロボティクス
研究機関	大同大学
研究代表者	柘植覚大同大学, 情報学部, 准教授 (00325250)
研究期間 (年度)	2007 – 2010
キーワード	特定話者 / 話者内音声変動 / 音声認識 / 音声分析
研究概要	同一発声者が特定の音声認識(話者依存音声認識)システムを使用した場合においても必ず毎回同一の音声認識結果とならない。このような音声認識結果の異なりは、「さっき認識したのに、なんで今回認識しないのだろう?」というような音声認識システムへの不信感につながり、音声認識が広く一般に普及しない原因の一つとなっている。音声は個人性により大きく変動することもさることながら、個々人が同一内容を発声したとしても、気分や発声環境により変動(音声変動)する。これが認識結果の変動を引き起こす原因となっている。本研究では、特定話者ならば長期間に渡り、安定した高精度の音声認識ができる音声認識手法の確立を目標とする。申請期間において、科学的側面から特定話者(個々人)の音声が時期、時間、体調、気分、環境などの違いでどのように変動するかを明確にし、これらの音声変動に頑健な特定話者音声認識手法を確立する。

研究成果

(19件)

すべて 2011 2010 2009 2008 2007 その他

すべて学会発表 (18件) 備考 (1件)

[学会発表] フィルタバンク特徴量とEarth Mover's Distanceを用いた音楽検索2011
- 著者名/発表者名
  柘植覚, 他
- 学会等名
  第89回音楽情報科学研究会プログラム
- 年月日
  20110200
[学会発表] 音楽検索のための楽曲印象値の自動付与手法2011
- 著者名/発表者名
  三好真人, 柘植覚, 他
- 学会等名
  第89回音楽情報科学研究会プログラム
- 年月日
  20110200
[学会発表] 話者依存音声認識のための発音辞書・音響モデル適応手法2010
- 著者名/発表者名
  森健太郎, 柘植覚, 他
- 学会等名
  平成22年電気学会電子・情報・システム部門大会
- 年月日
  20100900
[学会発表] Music Impression Detection Method for User Independent Music Retrieval System2010
- 著者名/発表者名
  Masato Miyoshi, Satoru Tsuge, et.al
- 学会等名
  14th International Conference on Knowledge-Based and Intelligent Information & Engineering Systems
- 年月日
  20100900
[学会発表] Text-Independent Speaker Identification Based on Reducing Inter-Session Variability of Speech Feature Using PCA Transformation2010
- 著者名/発表者名
  Wenbin Zhang, Haoze Lu, Yasuo Horiuchi, Satoru Tsuge, Kenji Kita, Shingo Kuroiwa
- 学会等名
  2011 International Workshop on Nonlinear Circuits, Communication and Signal Processing
- 年月日
  20100300
[学会発表] Speaker verification method using bone-conduction and air-conduction speech2009
- 著者名/発表者名
  Satoru Tsuge, et.al
- 学会等名
  ISPACS 2009
- 年月日
  20091200
[学会発表] 繰り返し発声を用いた突発性雑音に頑健な音声認識に関する研究2009
- 著者名/発表者名
  柏原康徳, 柘植覚, 他
- 学会等名
  平成21年度電気学会電子情報システム部門大会
- 年月日
  20090900
[学会発表] 気導音と骨導音を併用した話者ベクトルを用いた話者識別2009
- 著者名/発表者名
  中尾昌史, 柘植覚, 他
- 学会等名
  平成21年度電気学会電子情報システム部門大会
- 年月日
  20090900
[学会発表] Text-Independent Speaker Verification Using Rank Threshold in Large Number of Speaker Models2009
- 著者名/発表者名
  Haruka Okamoto, Satoru Tsuge, et.al
- 学会等名
  InterSpeech 2009
- 年月日
  20090900
[学会発表] Non-Stationary Noise Robust Speech Recognition Method using Repetitive Phrase2009
- 著者名/発表者名
  Yasunori Kashihara, Satoru Tsuge, et.al
- 学会等名
  NCSP2009
- 年月日
  20090300
[学会発表] Specific speakers' speech corpus over long and short time period2008
- 著者名/発表者名
  Satoru Tsuge, et.al
- 学会等名
  Oriental COCOSDA
- 年月日
  20081100
[学会発表] Combination method of Bone-conduction Speech and Air-conduction Speech for Speaker Recognition2008
- 著者名/発表者名
  Satoru Tsuge, et.al
- 学会等名
  Interspeech 2008
- 年月日
  20080900
[学会発表] A Study of speaker identification using phoneme-information2008
- 著者名/発表者名
  Katsuyuki Oobayashi, Satoru Tsuge, et.al
- 学会等名
  NCSP'2008
- 年月日
  20080300
[学会発表] 骨導音と気導音を併用した話者識別手法2008
- 著者名/発表者名
  柘植覚, 他
- 学会等名
  日本音響学会秋季研究発表
- 年月日
  20080300
[学会発表] 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験2007
- 著者名/発表者名
  喜多雅彦, 柘植覚, 他
- 学会等名
  情報処理学会音声言語情報処理
- 年月日
  20071200
[学会発表] 日本語大規模話者認識用データベースを用いた話者識別実験2007
- 著者名/発表者名
  柘植覚, 他
- 学会等名
  日本音響学会春季研究発表会
- 年月日
  20070900
[学会発表] Analysis of Variation on Intra-Speakers Speech Recognition Performances2007
- 著者名/発表者名
  Satoru Tsuge, Keiji Seida, Masami Shishibori, Kenji Kita, Fuji Ren, Kenji Kita, Minoru Fukumi, Shingo Kuroiwa
- 学会等名
  IEEE NLP-KE2007
- 年月日
  20070800
[学会発表] Automatic Utterance Segmentation Tool for Speech Corpus2007
- 著者名/発表者名
  Mitsuhiro Ozawa, Satoru Tsuge, Masami Shishibori, Kenji Kita, Minoru Fukumi, Fuji Ren, Shingo Kuroiwa
- 学会等名
  IEEE NLP-KE2007
- 年月日
  20070800
[備考] ホームページ等

2010 年度 研究成果報告書

長・短期間の音声変動の解明および音声変動に頑健な音声認識手法に関する研究

研究代表者

柘植 覚 大同大学, 情報学部, 准教授 (00325250)

研究成果

[学会発表] フィルタバンク特徴量とEarth Mover's Distanceを用いた音楽検索2011

著者名/発表者名

学会等名

年月日

[学会発表] 音楽検索のための楽曲印象値の自動付与手法2011

著者名/発表者名

学会等名

年月日

[学会発表] 話者依存音声認識のための発音辞書・音響モデル適応手法2010

著者名/発表者名

学会等名

年月日

[学会発表] Music Impression Detection Method for User Independent Music Retrieval System2010

著者名/発表者名

学会等名

年月日

[学会発表] Text-Independent Speaker Identification Based on Reducing Inter-Session Variability of Speech Feature Using PCA Transformation2010

著者名/発表者名

学会等名

年月日

[学会発表] Speaker verification method using bone-conduction and air-conduction speech2009

著者名/発表者名

学会等名

年月日

[学会発表] 繰り返し発声を用いた突発性雑音に頑健な音声認識に関する研究2009

著者名/発表者名

学会等名

年月日

[学会発表] 気導音と骨導音を併用した話者ベクトルを用いた話者識別2009

著者名/発表者名

学会等名

年月日

[学会発表] Text-Independent Speaker Verification Using Rank Threshold in Large Number of Speaker Models2009

著者名/発表者名

学会等名

年月日

[学会発表] Non-Stationary Noise Robust Speech Recognition Method using Repetitive Phrase2009

著者名/発表者名

学会等名

年月日

[学会発表] Specific speakers' speech corpus over long and short time period2008

著者名/発表者名

学会等名

年月日

[学会発表] Combination method of Bone-conduction Speech and Air-conduction Speech for Speaker Recognition2008

著者名/発表者名

学会等名

年月日

[学会発表] A Study of speaker identification using phoneme-information2008

著者名/発表者名

学会等名

年月日

[学会発表] 骨導音と気導音を併用した話者識別手法2008

著者名/発表者名

学会等名

年月日

[学会発表] 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験2007

著者名/発表者名

学会等名

年月日

[学会発表] 日本語大規模話者認識用データベースを用いた話者識別実験2007

著者名/発表者名

学会等名

年月日

[学会発表] Analysis of Variation on Intra-Speakers Speech Recognition Performances2007

著者名/発表者名

学会等名

年月日

[学会発表] Automatic Utterance Segmentation Tool for Speech Corpus2007

著者名/発表者名

学会等名

年月日

[備考] ホームページ等

2010 年度研究成果報告書

柘植覚大同大学, 情報学部, 准教授 (00325250)