統計的手法を用いた知識情報モデルに基づく知的信号処理手法に関する研究

研究課題

研究課題/領域番号	17656128
研究種目	萌芽研究
配分区分	補助金
研究分野	通信・ネットワーク工学
研究機関	千葉大学 (2007) 徳島大学 (2005-2006)
研究代表者	黒岩眞吾千葉大学, 大学院・融合科学研究科, 教授 (20333510)
研究分担者	北研二徳島大学, 高度情報化基盤センター, 教授 (10243734) 任福継徳島大学, 大学院・ソシオテクノサィエンス研究部, 教授 (20264947) 柘植覚徳島大学, 大学院・ソシオテクノサィエンス研究部, 講師 (00325250)
研究期間 (年度)	2005 – 2007
研究課題ステータス	完了 (2007年度)
配分額 *注記	3,300千円 (直接経費: 3,300千円) 2007年度: 1,200千円 (直接経費: 1,200千円) 2006年度: 1,100千円 (直接経費: 1,100千円) 2005年度: 1,000千円 (直接経費: 1,000千円)
キーワード	音声学 / 音声認識 / 音声合成 / 知的信号処理 / 認知科学 / HMM音声合成 / 帯域拡張 / 音声強調 / パケットロス
研究概要	(1)繰り返し発声の統合手法の研究通信路においてパケットロスが生じた場合でも,同一話者が「く_いわ,くろ_わ,_ろいわ」(_がパケットロスし失われた音節と仮定)と繰り返し発声した音声を用い音声を復元,認識する手法の研究開発を行った。日常会話中から繰り返し発声を高精度で検出する手法としては,HMMよりもDPマッチングが有効であることを明らかとした。また,複数の発声を統合する際に生じる不連続性を低減するために,音声スペクトルを包絡情報と音源情報に分離した上で包絡情報を中心に統合を行う手法を開発した。擬似日常会話音声データによる実験により開発手法の有効性を確認した。 (2)音声の広帯域化手法の研究帯域制限された音声を音声認識することで,音素状態を推定し,さらに推定された音素状態から高域のスペクトルを推定し,元の音声と統合することで広帯域音声を作成する手法を開発・改良した。改良点のうち特に音質改善に有効だったのは,音源情報と包絡情報の分離を行うこと,及び,音源情報の広帯域化を行うことであった。新聞読み上げ発声により開発手法の有効性を確認した。 (3)音声の話者内変動の調査と話者性抽出法の研究音声欠落部に合成音声を補間した場合の違和感を低減させる研究の一環として,同一話者の音声がどの程度ばらつくかを音声認識率の変動という観点から調査した。さらに,本人の気分や周囲の環境により音声がどのように変動するかを調査した。また,話者認識実験(気道音と骨導音の両方を利用)を通じ話者性がどのような特徴空間に現れるかを検討した。

報告書

(3件)

研究成果
(21件)

すべて 2008 2007 2006

すべて雑誌論文 (12件) (うち査読あり 2件) 学会発表 (9件)

[雑誌論文] 符号化音声認識のための合成音声を用いた不特定話者音響モデルの適応法2007
- 著者名/発表者名
  原一眞
- 雑誌名
  
  電子情報通信学会論文誌(D) J90-D
  
  ページ: 2541-2549
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] Speaker Identification Method Using Earth Mover's Distance for CCC Speaker Recognition Evaluation 20062007
- 著者名/発表者名
  Shingo Kuroiwa
- 雑誌名
  
  International Journal of Computational Linguistics & Chinese Language Processing 12
  
  ページ: 239-254
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] スペクトルの微細構造を考慮した風雑音除去手法2007
- 著者名/発表者名
  黒岩眞吾
- 雑誌名
  
  電子情報通信学会論文誌(A) J90-A・1
  
  ページ: 1-12
- NAID
  10018038368
- 関連する報告書
  2006 実績報告書
[雑誌論文] 分散音声認識における実時間周波数特性正規化手法2007
- 著者名/発表者名
  柘植覚
- 雑誌名
  
  情報処理学会論文誌 48・2
  
  ページ: 900-908
- NAID
  110006207810
- 関連する報告書
  2006 実績報告書
[雑誌論文] Effects of Phoneme Type and Frequency on Distributed Speaker Identification and Verification2006
- 著者名/発表者名
  Mohamed Abdel Fattah
- 雑誌名
  
  IEICE Transactions on Information and Systems E89・5
  
  ページ: 1712-1719
- 関連する報告書
  2006 実績報告書
[雑誌論文] Non-Verbal Voice Emotion Analysis System2006
- 著者名/発表者名
  Shunji Mitsuyoshi
- 雑誌名
  
  International Journal of Innovative Computing, Information and Control 2・4
  
  ページ: 819-830
- 関連する報告書
  2006 実績報告書
[雑誌論文] 音声認識・音声合成を用いた音声途切れ補間手法2006
- 著者名/発表者名
  黒岩眞吾
- 雑誌名
  
  音響学会誌 62・1
  
  ページ: 3-9
- NAID
  10018035152
- 関連する報告書
  2005 実績報告書
[雑誌論文] Speaker Recognition for Wire/Wireless Communication Systems2006
- 著者名/発表者名
  Mohamed Abdel Fattah
- 雑誌名
  
  International Arab Journal of Information Technology 3・1
  
  ページ: 28-34
- 関連する報告書
  2005 実績報告書
[雑誌論文] Nonparametric Speaker Recognition Method using Earth Mover's Distance2006
- 著者名/発表者名
  黒岩眞吾
- 雑誌名
  
  IEICE Transactions on Information and Systems E89-D・3
  
  ページ: 1074-1081
- NAID
  110004719383
- 関連する報告書
  2005 実績報告書
[雑誌論文] Phoneme Based Speaker Modeling to Improve Speaker Recognition.2006
- 著者名/発表者名
  Mohamed Abdel Fattah
- 雑誌名
  
  Information 9・1
  
  ページ: 135-147
- 関連する報告書
  2005 実績報告書
[雑誌論文] Acoustic Model Adaptation for Codec Speech based on Learning-by-Doing Concept2006
- 著者名/発表者名
  黒岩眞吾
- 雑誌名
  
  Journal of Research on Computing Science 17・1
  
  ページ: 105-114
- 関連する報告書
  2005 実績報告書
[雑誌論文] Specific Speaker's Japanese Speech Corpus over Long and Short Time Periods2006
- 著者名/発表者名
  柘植覚
- 雑誌名
  
  Journal of Research on Computing Science 17・1
  
  ページ: 115-124
- 関連する報告書
  2005 実績報告書
[学会発表] 骨導音と気導音を併用した話者識別手法2008
- 著者名/発表者名
  柘植覚
- 学会等名
  日本音響学会春季研究発表会
- 発表場所
  千葉工業大学(津田沼)
- 年月日
  2008-03-17
- 関連する報告書
  2007 実績報告書
[学会発表] 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験2007
- 著者名/発表者名
  喜多雅彦
- 学会等名
  音声言語ワークショップ
- 発表場所
  NTT京阪奈ビル(けいはんな学研都市)
- 年月日
  2007-12-20
- 関連する報告書
  2007 実績報告書
[学会発表] 日本語大規模話者認識用データベースを用いた話者識別実験2007
- 著者名/発表者名
  柘植覚
- 学会等名
  日本音響学会秋季研究発表会,
- 発表場所
  山梨大学(甲府)
- 年月日
  2007-09-21
- 関連する報告書
  2007 実績報告書
[学会発表] IEEE NLP-KE20072007
- 著者名/発表者名
  Takanori Hirai
- 学会等名
  A speech emphasis method for noise-robust speech recognition by using repetitive phrase
- 発表場所
  北京(中国)
- 年月日
  2007-09-01
- 関連する報告書
  2007 実績報告書
[学会発表] Artificial Bandwidth Extension for Speech Signals using Speech Recognition2007
- 著者名/発表者名
  Shingo Kuroiwa
- 学会等名
  Interspeech 2007,
- 発表場所
  アントワープ(ベルギー)
- 年月日
  2007-08-31
- 関連する報告書
  2007 実績報告書
[学会発表] Analysis of Variation on Intra-Speakers Speech Recognition Performances2007
- 著者名/発表者名
  Satoru Tsuge
- 学会等名
  IEEE NLP-KE2007
- 発表場所
  北京(中国)
- 年月日
  2007-08-31
- 関連する報告書
  2007 実績報告書
[学会発表] 突発性雑音に頑健な音声認識実現のための繰り返し発声を用いた音声強調法の提案2007
- 著者名/発表者名
  平井孝則
- 学会等名
  人工知能学会言語・音声理解と対話処理研究会
- 発表場所
  徳島大学(徳島)
- 年月日
  2007-07-23
- 関連する報告書
  2007 実績報告書
[学会発表] 多数の話者モデル内での順位情報を用いた話者照合2007
- 著者名/発表者名
  喜多雅彦
- 学会等名
  人工知能学会言語・音声理解と対話処理研究会
- 発表場所
  徳島大学(徳島)
- 年月日
  2007-07-23
- 関連する報告書
  2007 実績報告書
[学会発表] 分散音声認識を用いた音声対話システムの検討2007
- 著者名/発表者名
  藤原祥平
- 学会等名
  人工知能学会言語・音声理解と対話処理研究会
- 発表場所
  徳島大学(徳島)
- 年月日
  2007-07-23
- 関連する報告書
  2007 実績報告書

統計的手法を用いた知識情報モデルに基づく知的信号処理手法に関する研究

研究代表者

黒岩 眞吾 千葉大学, 大学院・融合科学研究科, 教授 (20333510)

3,300千円 (直接経費: 3,300千円)

報告書

研究成果

[雑誌論文] 符号化音声認識のための合成音声を用いた不特定話者音響モデルの適応法2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Speaker Identification Method Using Earth Mover's Distance for CCC Speaker Recognition Evaluation 20062007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] スペクトルの微細構造を考慮した風雑音除去手法2007

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] 分散音声認識における実時間周波数特性正規化手法2007

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Effects of Phoneme Type and Frequency on Distributed Speaker Identification and Verification2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Non-Verbal Voice Emotion Analysis System2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 音声認識・音声合成を用いた音声途切れ補間手法2006

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Speaker Recognition for Wire/Wireless Communication Systems2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Nonparametric Speaker Recognition Method using Earth Mover's Distance2006

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Phoneme Based Speaker Modeling to Improve Speaker Recognition.2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Acoustic Model Adaptation for Codec Speech based on Learning-by-Doing Concept2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Specific Speaker's Japanese Speech Corpus over Long and Short Time Periods2006

著者名/発表者名

雑誌名

関連する報告書

[学会発表] 骨導音と気導音を併用した話者識別手法2008

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験2007

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 日本語大規模話者認識用データベースを用いた話者識別実験2007

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] IEEE NLP-KE20072007

著者名/発表者名

学会等名

発表場所

黒岩眞吾千葉大学, 大学院・融合科学研究科, 教授 (20333510)