長・短期間の音声変動の解明および音声変動に頑健な音声認識手法に関する研究

研究課題

研究課題/領域番号	19700172
研究種目	若手研究(B)
配分区分	補助金
研究分野	知覚情報処理・知能ロボティクス
研究機関	大同大学
研究代表者	柘植覚大同大学, 情報学部, 准教授 (00325250)
研究期間 (年度)	2007 – 2010
研究課題ステータス	完了 (2010年度)
配分額 *注記	3,900千円 (直接経費: 3,300千円、間接経費: 600千円) 2010年度: 780千円 (直接経費: 600千円、間接経費: 180千円) 2009年度: 780千円 (直接経費: 600千円、間接経費: 180千円) 2008年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円) 2007年度: 1,300千円 (直接経費: 1,300千円)
キーワード	特定話者 / 話者内音声変動 / 音声認識 / 音声分析 / 特定話者の話者内音声変動 / 音声変動
研究概要	同一発声者が特定の音声認識(話者依存音声認識)システムを使用した場合においても必ず毎回同一の音声認識結果とならない。このような音声認識結果の異なりは、「さっき認識したのに、なんで今回認識しないのだろう?」というような音声認識システムへの不信感につながり、音声認識が広く一般に普及しない原因の一つとなっている。音声は個人性により大きく変動することもさることながら、個々人が同一内容を発声したとしても、気分や発声環境により変動(音声変動)する。これが認識結果の変動を引き起こす原因となっている。本研究では、特定話者ならば長期間に渡り、安定した高精度の音声認識ができる音声認識手法の確立を目標とする。申請期間において、科学的側面から特定話者(個々人)の音声が時期、時間、体調、気分、環境などの違いでどのように変動するかを明確にし、これらの音声変動に頑健な特定話者音声認識手法を確立する。

報告書

(6件)

研究成果

(50件)

すべて 2011 2010 2009 2008 2007 その他

すべて学会発表 (49件) 備考 (1件)

[学会発表] フィルタバンク特徴量とEarth Mover's Distanceを用いた音楽検索2011
- 著者名/発表者名
  柘植覚, 三好真人, 肖清梅, 北研二
- 学会等名
  第89回音楽情報科学研究会プログラム
- 発表場所
  九州大学(福岡)
- 年月日
  2011-02-12
- 関連する報告書
  2010 実績報告書
[学会発表] 音楽検索のための楽曲印象値の自動付与手法2011
- 著者名/発表者名
  三好真人, 柘植覚, Choge Kipsang Hillary, 尾山匡浩, 伊藤桃代, 福見稔
- 学会等名
  第89回音楽情報科学研究会プログラム
- 発表場所
  九州大学(福岡)
- 年月日
  2011-02-12
- 関連する報告書
  2010 実績報告書
[学会発表] フィルタバンク特徴量とEarth Mover's Distanceを用いた音楽検索2011
- 著者名/発表者名
  柘植覚, 他
- 学会等名
  第89回音楽情報科学研究会プログラム
- 関連する報告書
  2010 研究成果報告書
[学会発表] 音楽検索のための楽曲印象値の自動付与手法2011
- 著者名/発表者名
  三好真人, 柘植覚, 他
- 学会等名
  第89回音楽情報科学研究会プログラム
- 関連する報告書
  2010 研究成果報告書
[学会発表] Music Impression Detection Method for User Independent Music Retrieval System2010
- 著者名/発表者名
  Masato Miyoshi, Satoru Tsuge, Hillary Kipsang Choge, Tadahiro Oyama, Momoyo Ito, Minorcu Fukumi
- 学会等名
  14th International Conference, on Knowledge-Based and Intelligent Information & Engineering Systems
- 発表場所
  カーディフ(英国)
- 年月日
  2010-09-09
- 関連する報告書
  2010 実績報告書
[学会発表] 話者依存音声認識のための発音辞書・音響モデル適応手法2010
- 著者名/発表者名
  森健太郎, 柘植覚, 伊藤桃代, 福見稔
- 学会等名
  平成22年電気学会電子・情報・システム部門大会
- 発表場所
  熊本大学(熊本)
- 年月日
  2010-09-02
- 関連する報告書
  2010 実績報告書
[学会発表] Text-Independent Speaker Identification Based on Reducing Inter-Session Variability of Speech Feature Using PCA Transformation2010
- 著者名/発表者名
  Wenbin Zhang, Haoze Lu, Yasuo Horiuchi, Satoru Tsuge, Kenji Kita, Shingo Kuroiwa
- 学会等名
  2011 International Workshop on Nonlinear Circuits,Communication and Signal Processing
- 発表場所
  天津(中国)
- 年月日
  2010-03-03
- 関連する報告書
  2010 実績報告書
[学会発表] 話者依存音声認識のための発音辞書・音響モデル適応手法2010
- 著者名/発表者名
  森健太郎, 柘植覚, 他
- 学会等名
  平成22年電気学会電子・情報・システム部門大会
- 関連する報告書
  2010 研究成果報告書
[学会発表] Text-Independent Speaker Identification Based on Reducing Inter-Session Variability of Speech Feature Using PCA Transformation2010
- 著者名/発表者名
  Wenbin Zhang, Haoze Lu, Yasuo Horiuchi, Satoru Tsuge, Kenji Kita, Shingo Kuroiwa
- 学会等名
  2011 International Workshop on Nonlinear Circuits, Communication and Signal Processing
- 関連する報告書
  2010 研究成果報告書
[学会発表] Music Impression Detection Method for User Independent Music Retrieval System2010
- 著者名/発表者名
  Masato Miyoshi, Satoru Tsuge, et.al
- 学会等名
  14th International Conference on Knowledge-Based and Intelligent Information & Engineering Systems
- 関連する報告書
  2010 研究成果報告書
[学会発表] Speaker verification method using bone-conduction and air-conduction speech2009
- 著者名/発表者名
  Satoru Tsuge
- 学会等名
  ISPACS 2009
- 発表場所
  金沢大学
- 年月日
  2009-12-08
- 関連する報告書
  2009 実績報告書
[学会発表] Text-Independent Speaker Verification Using Rank Threshold in Large Number of Sneaker Models2009
- 著者名/発表者名
  Haruka Okamoto
- 学会等名
  InterSpeech 2009
- 発表場所
  ブライトン・英国
- 年月日
  2009-09-09
- 関連する報告書
  2009 実績報告書
[学会発表] 繰り返し発声を用いた突発性雑音に頑健な音声認識に関する研究2009
- 著者名/発表者名
  柏原康徳
- 学会等名
  平成21年度電気学会電子情報システム部門大会
- 発表場所
  徳島大学
- 年月日
  2009-09-04
- 関連する報告書
  2009 実績報告書
[学会発表] 気導音と骨導音を併用した話者ベクトルを用いた話者識別2009
- 著者名/発表者名
  中尾昌史
- 学会等名
  平成21年度電気学会電子情報システム部門大会
- 発表場所
  徳島大学
- 年月日
  2009-09-04
- 関連する報告書
  2009 実績報告書
[学会発表] Non-Stationary Noise Robust Speech Recognition Method using Repetitive Phrase2009
- 著者名/発表者名
  柏原康徳
- 学会等名
  NCSP
- 発表場所
  ホノルル(ハワイ)
- 年月日
  2009-03-02
- 関連する報告書
  2008 実績報告書
[学会発表] Non-Stationary Noise Robust Speech Recognition Method using Repetitive Phrase2009
- 著者名/発表者名
  Yasunori Kashihara, Satoru Tsuge, et.al
- 学会等名
  NCSP2009
- 関連する報告書
  2010 研究成果報告書
[学会発表] 繰り返し発声を用いた突発性雑音に頑健な音声認識に関する研究2009
- 著者名/発表者名
  柏原康徳, 柘植覚, 他
- 学会等名
  平成21年度電気学会電子情報システム部門大会
- 関連する報告書
  2010 研究成果報告書
[学会発表] 気導音と骨導音を併用した話者ベクトルを用いた話者識別2009
- 著者名/発表者名
  中尾昌史, 柘植覚, 他
- 学会等名
  平成21年度電気学会電子情報システム部門大会
- 関連する報告書
  2010 研究成果報告書
[学会発表] Speaker verification method using bone-conduction and air-conduction speech2009
- 著者名/発表者名
  Satoru Tsuge, et.al
- 学会等名
  ISPACS 2009
- 関連する報告書
  2010 研究成果報告書
[学会発表] Text-Independent Speaker Verification Using Rank Threshold in Large Number of Speaker Models2009
- 著者名/発表者名
  Haruka Okamoto, Satoru Tsuge, et.al
- 学会等名
  InterSpeech 2009
- 関連する報告書
  2010 研究成果報告書
[学会発表] Non-Stationary Noise Robust Speech Recognition Method using Repetitive Phrase2009
- 著者名/発表者名
  Yasunori Kashihara, Satoru Tsuge, Kipsang H. Choge, Tadahiro Oyama, Minoru Fukumi, Shingo Kuroiwa
- 学会等名
  Proc. of NCSP'2009
- 発表場所
  Hawaii U.S. A
- 関連する報告書
  2009 自己評価報告書
[学会発表] 繰り返し発声を用いた突発性雑音に頑健な音声認識に関する研究2009
- 著者名/発表者名
  柏原康徳, 柘植覚, 尾山匡浩, Choge Hillary Kipsang, 福見稔, 黒岩眞吾
- 学会等名
  平成21年度電気学会電子情報システム部門大会
- 発表場所
  徳島
- 関連する報告書
  2009 自己評価報告書
[学会発表] 気導音と骨導音を併用した話者ベクトルを用いた話者識別2009
- 著者名/発表者名
  中尾昌史, 柘植覚, 福見稔
- 学会等名
  平成21年度電気学会電子情報システム部門大会
- 発表場所
  徳島
- 関連する報告書
  2009 自己評価報告書
[学会発表] Speaker verification method using boneconduction and air- conduction speech2009
- 著者名/発表者名
  Satoru Tsuge, Daichi Koizumi, Minoru Fukumi, Shingo Kuroiwa
- 学会等名
  Proc. of ISPACS 2009
- 発表場所
  Kanazawa Japan
- 関連する報告書
  2009 自己評価報告書
[学会発表] Text-Independent Speaker Verification Using Rank Threshold in Large Number of Speaker Models2009
- 著者名/発表者名
  Haruka Okamoto, Amira Abdelwahab, Masahumi Nishida, Satoru Tsuge, Yasuo Horiuchi, Shingo Kuroiwa
- 学会等名
  Proc. of InterSpeech 2009
- 発表場所
  Brighton U.K.
- 関連する報告書
  2009 自己評価報告書
[学会発表] Specific speakers'speech corpus over long and short time period2008
- 著者名/発表者名
  柘植覚
- 学会等名
  oriental COCOSDA
- 発表場所
  京都
- 年月日
  2008-11-25
- 関連する報告書
  2008 実績報告書
[学会発表] Combination method of Bone-conduction Speech and Air-conduction Speech for Speaker Recognition2008
- 著者名/発表者名
  柘植覚
- 学会等名
  Interspeech 2008
- 発表場所
  ブリスベン(オーストラリア)
- 年月日
  2008-09-23
- 関連する報告書
  2008 実績報告書
[学会発表] A Study of speaker identification using phoneme-information2008
- 著者名/発表者名
  Katsuyuki Oobayashi, Satoru Tsuge, et.al
- 学会等名
  NCSP'2008
- 関連する報告書
  2010 研究成果報告書
[学会発表] 骨導音と気導音を併用した話者識別手法2008
- 著者名/発表者名
  柘植覚, 他
- 学会等名
  日本音響学会秋季研究発表
- 関連する報告書
  2010 研究成果報告書
[学会発表] Combination method of Bone-conduction Speech and Air-conduction Speech for Speaker Recognition2008
- 著者名/発表者名
  Satoru Tsuge, et.al
- 学会等名
  Interspeech 2008
- 関連する報告書
  2010 研究成果報告書
[学会発表] Specific speakers' speech corpus over long and short time period2008
- 著者名/発表者名
  Satoru Tsuge, et.al
- 学会等名
  Oriental COCOSDA
- 関連する報告書
  2010 研究成果報告書
[学会発表] A Study of speaker identification using phoneme-information2008
- 著者名/発表者名
  Katsuyuki Oobayashi, Satoru Tsuge, Minoru Fukumi, Seiji Tsuchiya, Ryosuke Sumitomo, Fuji Ren, Shingo Kuroiwa
- 学会等名
  Proc. of NCSP'2008
- 発表場所
  Gold Coast, Australia
- 関連する報告書
  2009 自己評価報告書
[学会発表] 骨導音と気導音を併用した話者識別手法2008
- 著者名/発表者名
  柘植覚, 喜多雅彦, 長内隆, 蒔苗久則, 鎌田敏明, 谷本益巳, 福見稔, 任福継、黒岩眞吾
- 学会等名
  日本音響学会秋季研究発表会
- 発表場所
  千葉
- 関連する報告書
  2009 自己評価報告書
[学会発表] Combination method of Bone-conduction Speech and Air-conduction Speech for Speaker Recognition2008
- 著者名/発表者名
  Satoru Tsuge, Osanai Takashi, Makinae Hisanori, Kamada Toshiaki, Minoru Fukumi, Shingo Kuroiwa
- 学会等名
  Proc. of Interspeech 2008
- 発表場所
  Brisbane Australia
- 関連する報告書
  2009 自己評価報告書
[学会発表] Specific speakers' speech corpus over long and short time period2008
- 著者名/発表者名
  Satoru Tsuge, Minoru Fukumi, Shingo Kuroiwa
- 学会等名
  Proc. of oriental COCOSDA
- 発表場所
  Kyoto Japan
- 関連する報告書
  2009 自己評価報告書
[学会発表] A Study of speaker identification using phoneme-information2008
- 著者名/発表者名
  Katsuyuki OOBAYASHI
- 学会等名
  of NCSP '2008
- 発表場所
  Gold Coast,Austraria
- 関連する報告書
  2007 実績報告書
[学会発表] 骨導音と気導音を併用した話者識別手法2008
- 著者名/発表者名
  柘植覚
- 学会等名
  日本音響学会秋季研究発表会
- 発表場所
  千葉工業大学
- 関連する報告書
  2007 実績報告書
[学会発表] Analysis of Variation on Intra-Speakers Speech Recognition Performances2007
- 著者名/発表者名
  Satoru Tsuge, Keiji Seida, Masami Shishibori, Kenji Kita, Fuji Ren, Kenji Kita, Minoru Fukumi, Shingo Kuroiwa
- 学会等名
  IEEE NLP-KE2007
- 関連する報告書
  2010 研究成果報告書
[学会発表] Automatic Utterance Segmentation Tool for Speech Corpus2007
- 著者名/発表者名
  Mitsuhiro Ozawa, Satoru Tsuge, Masami Shishibori, Kenji Kita, Minoru Fukumi, Fuji Ren, Shingo Kuroiwa
- 学会等名
  IEEE NLP-KE2007
- 関連する報告書
  2010 研究成果報告書
[学会発表] 日本語大規模話者認識用データベースを用いた話者識別実験2007
- 著者名/発表者名
  柘植覚, 他
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2010 研究成果報告書
[学会発表] 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験2007
- 著者名/発表者名
  喜多雅彦, 柘植覚, 他
- 学会等名
  情報処理学会音声言語情報処理
- 関連する報告書
  2010 研究成果報告書
[学会発表] Analysis of Variation on Intra-Speakers Speech Recognition Performances2007
- 著者名/発表者名
  Satoru Tsuge, Keiji Seida, Masami Shishibori, Kenji Kita, Fuji Ren, Minoru Fukumi, Shingo Kuroiwa
- 学会等名
  Proc. of IEEE NLP-KE2007
- 発表場所
  Beijing China
- 関連する報告書
  2009 自己評価報告書
[学会発表] Minoru Fukumi, and Shingo Kuroiwa, Automatic Utterance Segmentation Tool for Speech Corpus2007
- 著者名/発表者名
  Mitsuhiro Ozawa, Satoru Tsuge, Masami Shishibori, Kenji Kita, Fuji Ren, Minoru Fukumi, Shingo Kuroiwa
- 学会等名
  Proc. of IEEE NLP-KE2007
- 発表場所
  Beijing China
- 関連する報告書
  2009 自己評価報告書
[学会発表] 日本語大規模話者認識用データベースを用いた話者識別実験2007
- 著者名/発表者名
  柘植覚, 黒岩眞吾, 喜多雅彦, 蒔苗久則, 長内隆, 鎌田敏明, 谷本益巳, 福見稔, 任福継
- 学会等名
  日本音響学会春季研究発表会
- 発表場所
  山梨
- 関連する報告書
  2009 自己評価報告書
[学会発表] 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験2007
- 著者名/発表者名
  喜多雅彦, 柘植覚, 黒岩眞吾, 任福継
- 学会等名
  情報処理学会音声言語情報処理
- 発表場所
  京都
- 関連する報告書
  2009 自己評価報告書
[学会発表] Analysis of Variation on Intra-Speakers Speech Recognition Performances2007
- 著者名/発表者名
  Satoru TSUGE
- 学会等名
  IEEE NLP-KE2007
- 発表場所
  Beiling China
- 関連する報告書
  2007 実績報告書
[学会発表] Automatic Utterance Segmentation Tool for Speech Corpus2007
- 著者名/発表者名
  Mitsuhiro OZAWA
- 学会等名
  IEEE NLP-KE2007
- 発表場所
  Beiling China
- 関連する報告書
  2007 実績報告書
[学会発表] 日本語大規模話者認識用データベースを用いた話者識別実験2007
- 著者名/発表者名
  柘植覚
- 学会等名
  日本音響学会春季研究発表会
- 発表場所
  山梨大学
- 関連する報告書
  2007 実績報告書
[学会発表] 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験2007
- 著者名/発表者名
  喜多雅彦
- 学会等名
  情報処理学会音声言語情報処理
- 発表場所
  京都・日本
- 関連する報告書
  2007 実績報告書
[備考] ホームページ等
- 関連する報告書
  2010 研究成果報告書

長・短期間の音声変動の解明および音声変動に頑健な音声認識手法に関する研究

研究代表者

柘植 覚 大同大学, 情報学部, 准教授 (00325250)

3,900千円 (直接経費: 3,300千円、間接経費: 600千円)

報告書

研究成果

[学会発表] フィルタバンク特徴量とEarth Mover's Distanceを用いた音楽検索2011

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 音楽検索のための楽曲印象値の自動付与手法2011

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] フィルタバンク特徴量とEarth Mover's Distanceを用いた音楽検索2011

著者名/発表者名

学会等名

関連する報告書

[学会発表] 音楽検索のための楽曲印象値の自動付与手法2011

著者名/発表者名

学会等名

関連する報告書

[学会発表] Music Impression Detection Method for User Independent Music Retrieval System2010

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 話者依存音声認識のための発音辞書・音響モデル適応手法2010

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Text-Independent Speaker Identification Based on Reducing Inter-Session Variability of Speech Feature Using PCA Transformation2010

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 話者依存音声認識のための発音辞書・音響モデル適応手法2010

著者名/発表者名

学会等名

関連する報告書

[学会発表] Text-Independent Speaker Identification Based on Reducing Inter-Session Variability of Speech Feature Using PCA Transformation2010

著者名/発表者名

学会等名

関連する報告書

[学会発表] Music Impression Detection Method for User Independent Music Retrieval System2010

著者名/発表者名

学会等名

関連する報告書

[学会発表] Speaker verification method using bone-conduction and air-conduction speech2009

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Text-Independent Speaker Verification Using Rank Threshold in Large Number of Sneaker Models2009

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 繰り返し発声を用いた突発性雑音に頑健な音声認識に関する研究2009

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 気導音と骨導音を併用した話者ベクトルを用いた話者識別2009

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

柘植覚大同大学, 情報学部, 准教授 (00325250)