2013 Fiscal Year Research-status Report
音声認識における誤認識要因の解明およびシステム利用のための訓練方法の確立
Project/Area Number |
25730117
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | Daido University |
Principal Investigator |
柘植 覚 大同大学, 情報学部, 准教授 (00325250)
|
Project Period (FY) |
2013-04-01 – 2017-03-31
|
Keywords | 音声認識 / 音声認識訓練システム / 誤認識要因の解明 / 音声インタフェース |
Research Abstract |
人間のコミュニケーション手段の一つである音声をコンピュータなどとのコミュニケーションに利用するためには音声インタフェースが必要となる。近年、音声インターフェースは、カーナビゲーションや携帯電話などに搭載されるようになり、我々の身近な存在となりつつある。しかし、利用者がそれらを積極的に使用しているとの話はほとんど聞かれず、未だ音声はコンピュータなどとのインタフェースとして定着していない。この原因として、音声認識システムの誤認識が影響していると思われる。音声認識の誤認識は、必ずしもシステムだけの影響ではなく、利用者が音声インタフェースに対して熟練度が低いために生じる場合も存在すると考えられる。 本研究では、『音声認識の誤認識要因の解明』および『音声認識システム利用のための訓練方法の確立』に関し研究を進めている。音声認識システムが誤認識する発声に対し、音響的観点および言語的観点から詳細に分析し、誤認識の要因を明白にする。その後、誤認識を回避する簡易でかつ効果的な訓練方法の確立を目指す。この訓練方法が確立できれば、音声インタフェースの普及を促進できると思われる。 2013年度は、システムに実際に入力された音声を収集するため、音声認識による大学案内システムを構築した。本システムは大学案内を対話的に行うシステムであり、この対話システムを利用する事により、実際の音声を収集する。また、講演音声に対する音声認識実験を異なる言語モデルを用い行ない、誤認識要因の分析を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
2013年度の『音声認識における誤認識要因の解明』に関して、不特定話者音声認識実験における誤認識要因の調査として、背景雑音や入力系の際の影響が少ない既存の音声データベースを用い、不特定話者音声認識実験を行い、誤認識要因を調査し、誤認識した音声の特徴量を二次元空間に射影し、複数の観点(空間)より分析を行う。また、認識に使用する言語モデルを様々なレベル(単語、音節、音素など)で構築し実験を行い、言語制約が引き起こす誤認識要因を調査する。ことを予定していた。実際には、これらの中から言語制約が引き起こす原因のみの実験しかできなかった。また、特定話者音声認識実験における誤認識要因の調査として、特定話者に対し音声認識実験を行い、個人性以外の誤認識要因を調査することを予定していたが、不特定話者音声認識実験に時間がかかり手をつけることができなかった。 また、音声認識器利用者のための訓練手法の確立の前段階として、2014年度より使用する音声認識システムのプロトタイプとして、文法規則に基づく不特定話者連続単語音声認識システムの開発を予定していた。音声認識システムに関しては、当初予定通り、文法規則に基づく大学案内システムを構築できた。
|
Strategy for Future Research Activity |
2014年度は、2013年度に行なえなかった特定話者音声認識実験における誤認識要因の調査として、特定話者に対し音声認識実験を行い、個人性以外の誤認識要因を調査する。2013年度に行った不特定話者との比較を行い、話者固有の音声認識誤り、発声変形などの話者間に共通の音声認識誤りの分析を行う。また、2013年度に作成した音声認識システムを利用し、システムに対する入力発声の収集を行うとともに、音声認識実験を行い、読み上げ発話とシステムへの入力発話の音声認識結果の傾向を分析する。さらに、音声認識システムに、音声パワーレベルや母音間距離などを表示する機能を追加し、音声認識の誤認識の発生回数などを検討する。また、これらの音声の聴取実験により、人間による音声認識の観点からもこれらの発声の分析を進める。 これらの分析結果をもとに効率的な音声認識システム訓練システムの作成に取り掛かる予定とする。
|
Expenditure Plans for the Next FY Research Funding |
予定をしていた計算機の購入が間に合わず、2014年度に繰り越しを行った。 また、予定をしていた国内旅費がインフルエンザが発症し中止をしたため、予算の繰り越しとなった。 昨年度購入予定であった高速計算機を購入し、昨年度行なえなかった実験を早急に行う予定である。
|