研究課題/領域番号 |
12J09555
|
研究機関 | 立命館大学 |
研究代表者 |
福森 隆寛 立命館大学, 情報理工学研究科, 特別研究員(DC1)
|
キーワード | 音声認識 / 音声情報処理 |
研究概要 |
本研究では、環境や話者の個人性が音声認識システムに与える影響をリアルタイムで推定し、外乱に頑健な音声認識システムを構築することを目指して、科学研究費補助金交付期間内に下記の項目について重点的に検討を行う。 1、雑音成分が音声認識システムに与える影響を頑健に推定できる雑音指標の策定 2、話者の個人性が音声認識システムに与える影響を頑健に推定できる話者依存指標の策定 3、1、と2、と残響指標を統合した音声認識性能の自動推定・検知手法の確立 4、1、~3、を統合した音声認識性能を自動推定・検知するシステムの設計・構築 平成24年度では「1、」と「2、」を実施し、平成25年度では、上記項目の「3、1、と2、と残響指標を統合した音声認識性能の自動推定・検知手法の確立」に取り組んだ。特に平成25年度は、実際の生活環境に近い状況(様々な雑音や室内の反響が混在する環境)を計算機上でシミュレーションし、これまでに策定した指標(雑音指標・残響指標・話者依存指標)を用いて、模擬した利用環境が音声認識システムに与える影響を自動推定・検知する手法を提案した。その結果、雑音・残響指標を統合することで、雑音や残響が複合的に存在する環境が音声認識システムに与える影響を高精度に推定することができた。また、話者の個人性(平成25年度は、特に発話様式に着目)についても、音声認識システムに与える影響を正確かつ頑健に自動検知できることを確認できた。平成26年度(研究期間の最終年度)は、上記項目の「4、1、~3、を統合した音声認識性能を自動推定・検知するシステムの設計・構築」に取り組む計画である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
音声認識技術を利用するためには、雑音、残響、話者の個人性への対策が不可欠である。平成25年度は、特に実際の生活環境に近い状況(音声認識システムの性能劣化を招く要因が複合的に存在する環境)を想定して評価を行った。そして、このような利用環境が音声認識システムに与える影響を正確に自動推定できることを実証し、本研究課題の実用化の可能性を示すことができたことから、おおむね順調に研究が進展していると考える。
|
今後の研究の推進方策 |
今後の研究の推進方策として、平成25年度で確立した「雑音・残響・話者依存指標を用いた音声認識性能の自動推定・検知手法」を搭載した音声認識システムの開発に取り組む予定である。具体的には、利用環境が音声認識システムに与える影響を自動推定・検知し、その影響を効果的に取り除くことができる対策を事前にシステムへ反映させて、常に最大性能を発揮できる音声認識システム設計を行う。特に本研究の有効性を示すために、平成24年度で収集した大規模な音声・音響試料を使用した検証実験や、アウトリーチ活動を通した実証実験に取り組む予定である。
|