統計的手法を用いた知識情報モデルに基づく知的信号処理手法に関する研究
Project/Area Number |
17656128
|
Research Category |
Grant-in-Aid for Exploratory Research
|
Allocation Type | Single-year Grants |
Research Field |
Communication/Network engineering
|
Research Institution | Chiba University (2007) The University of Tokushima (2005-2006) |
Principal Investigator |
黒岩 眞吾 Chiba University, 大学院・融合科学研究科, 教授 (20333510)
|
Co-Investigator(Kenkyū-buntansha) |
北 研二 徳島大学, 高度情報化基盤センター, 教授 (10243734)
任 福継 徳島大学, 大学院・ソシオテクノサィエンス研究部, 教授 (20264947)
柘植 覚 徳島大学, 大学院・ソシオテクノサィエンス研究部, 講師 (00325250)
|
Project Period (FY) |
2005 – 2007
|
Project Status |
Completed (Fiscal Year 2007)
|
Budget Amount *help |
¥3,300,000 (Direct Cost: ¥3,300,000)
Fiscal Year 2007: ¥1,200,000 (Direct Cost: ¥1,200,000)
Fiscal Year 2006: ¥1,100,000 (Direct Cost: ¥1,100,000)
Fiscal Year 2005: ¥1,000,000 (Direct Cost: ¥1,000,000)
|
Keywords | 音声学 / 音声認識 / 音声合成 / 知的信号処理 / 認知科学 / HMM音声合成 / 帯域拡張 / 音声強調 / パケットロス |
Research Abstract |
(1)繰り返し発声の統合手法の研究 通信路においてパケットロスが生じた場合でも,同一話者が「く_いわ,くろ_わ,_ろいわ」(_がパケットロスし失われた音節と仮定)と繰り返し発声した音声を用い音声を復元,認識する手法の研究開発を行った。日常会話中から繰り返し発声を高精度で検出する手法としては,HMMよりもDPマッチングが有効であることを明らかとした。また,複数の発声を統合する際に生じる不連続性を低減するために,音声スペクトルを包絡情報と音源情報に分離した上で包絡情報を中心に統合を行う手法を開発した。擬似日常会話音声データによる実験により開発手法の有効性を確認した。 (2)音声の広帯域化手法の研究 帯域制限された音声を音声認識することで,音素状態を推定し,さらに推定された音素状態から高域のスペクトルを推定し,元の音声と統合することで広帯域音声を作成する手法を開発・改良した。改良点のうち特に音質改善に有効だったのは,音源情報と包絡情報の分離を行うこと,及び,音源情報の広帯域化を行うことであった。新聞読み上げ発声により開発手法の有効性を確認した。 (3)音声の話者内変動の調査と話者性抽出法の研究 音声欠落部に合成音声を補間した場合の違和感を低減させる研究の一環として,同一話者の音声がどの程度ばらつくかを音声認識率の変動という観点から調査した。さらに,本人の気分や周囲の環境により音声がどのように変動するかを調査した。また,話者認識実験(気道音と骨導音の両方を利用)を通じ話者性がどのような特徴空間に現れるかを検討した。
|
Report
(3 results)
Research Products
(21 results)