2012 Fiscal Year Annual Research Report
Project/Area Number |
12J09555
|
Research Institution | Ritsumeikan University |
Principal Investigator |
福森 隆寛 立命館大学, 情報理工学研究科, 特別研究員(DC1)
|
Keywords | 音声認識 / 音声情報処理 |
Research Abstract |
本研究では、環境や話者の個人性が音声認識システムに与える影響をリアルタイムで推定し、外乱に頑健な音声認識システムを構築することを目指して、科学研究費補助金交付期間内に下記の項目について重点的に検討を行う。 1、雑音成分が音声認識システムに与える影響を頑健に推定できる雑音指標の策定 2、話者の個人性が音声認識システムに与える影響を頑健に推定できる話者依存指標の策定 3、1、と2、と残響指標を統合した音声認識性能の自動推定・検知手法の確立 4、1、~3、を統合した音声認識性能を自動推定・検知するシステムの設計・構築 平成24年度は、上記項目の「1、雑音成分が音声認識システムに与える影響を頑健に推定できる雑音指標の策定」と「2、話者の個人性が音声認識システムに与える影響を頑健に推定できる話者依存指標の策定」を行った。具体的には、多種にわたる雑音試料(例えば、車の走行音、空調機の騒音、人混みの雑踏など)や多種類の音声特徴量(例えば、発話様式、滑舌の優劣、性別、年代別など)を包含した音声試料を大規模に収集し、その収集した試料に基づいて雑音や話者の個人性を自動推定・検知するための指標策定およびアルゴリズム開発に取り組んだ。その結果、策定した雑音指標と話者依存指標を用いて雑音や話者の個人性が音声認識システムに与える影響を高精度に推定することができた。 今後は上記項目の「1、と2、と残響指標を統合した音声認識性能の自動推定・検知手法の確立」に取り組む計画である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
音声認識などの音声情報処理技術を実環境で利用するには、雑音や話者の個人性への対策が不可欠である。平成24年度は、特に雑音や話者の個人性に対する音声認識システムの性能改善を視野に入れながら、雑音下で発声された音声の分析、残響対策など、音声認識に関して幅広く複数のテーマを設定しながら研究を展開できたことから、おおむね順調に研究が進展していると考える。
|
Strategy for Future Research Activity |
今後の研究の推進方策として、平成24年度で策定した雑音と話者の個人性に対する音声認識性能の劣化を自動推定・検知できる雑音指標と話者依存指標に加えて、これまでに策定した残響指標を統合する。そして統合した指標を用いて、複数の外乱要因に対して頑健に音声認識性能の劣化を同時推定できるシステム開発に取り組む計画である。特に本研究の有効性を示すために、平成24年度で収集した大規模な音声・音響試料を使用して、本研究の実用性に関する検証実験に取り組む予定である。
|