2015 Fiscal Year Research-status Report
音声認識における誤認識要因の解明およびシステム利用のための訓練方法の確立
Project/Area Number |
25730117
|
Research Institution | Daido University |
Principal Investigator |
柘植 覚 大同大学, 情報学部, 准教授 (00325250)
|
Project Period (FY) |
2013-04-01 – 2017-03-31
|
Keywords | 音声認識 / 音声インタフェース / 音声認識システム訓練方法 / 誤認識要因の解明 |
Outline of Annual Research Achievements |
人間のコミュニケーション手段の一つである音声をコンピュータなどとのコミュニケーションに利用するためには音声インタフェースが必要となる。近年、音声インターフェースは、カーナビゲーションや携帯電話などに搭載されるようになり、我々の身近な存在となりつつある。しかし、利用者がそれらを積極的に使用しているとの話はほとんど聞かれず、未だ音声はコンピュータなどとのインタフェースとして定着していない。この原因として、音声認識システムの誤認識が影響していると思われる。音声認識の誤認識は、必ずしもシステムだけの影響ではなく、利用者が音声インタフェースに対して熟練度が低いために生じる場合も存在すると考えられる。本研究では、『音声認識の誤認識要因の解明』および『音声認識システム利用のための訓練方法の確立』に関し研究を進めている。 2014年度までにおいて、AndoroidOSを用いた音声対話による地図案内システムを構築し、様々な場面での音声入力を行える環境を整えた。また、雑音下音声認識用評価基盤「CENSREC-1」を用いた誤認識要因の解明を行い、雑音により音声認識精度が劣化する事を確認するとともに、特定の数字の特徴が雑音との特徴と類似していることが明確にした。 2015年度においては、実際に音声認識システムに対して3名の特定話者が半年間に渡り音声入力を行い、その誤り傾向を分析し誤認識要因の解明を試みた。誤認識要因の一つとして、話者が音声認識システムに精通しておらず、認識可能な語彙の把握がなされていないために起こる音声認識誤りが存在する事を解明した。また、音声認識システムの評価尺度として一般に用いられる単語正解率に対しても正解系列とのマッチングに不備があると音声認識システムを正当に評価ができないことが解った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
2013年度において、『音声認識における誤認識要因の解明』に関することの研究進歩が十分でなく、その影響において2014年度も遅れが生じてしまった。さらに、2014年度において、雑音下での誤認識要因の解明を行ったが、まだ、話者の違いによる分析など不十分な点があり、研究計画通りに進んでいないのが現状である。 また、音声認識器利用者のための訓練手法の確立の前段階として、音声収集用のシステムおよび不特定の場所での音声認識システムを使用するため、携帯端末上で動作する音声ん式システムを構築し、訓練方法の第一歩目を動き始めたが、AndroidOSにシステムを構築する事に時間がかかり、科学的な分析には至っておらず、訓練方法をどのようにするかなどの検討ができていない。このような原因により、予定通りの進捗となっていない。
|
Strategy for Future Research Activity |
2016年度は、現在までの研究進捗の遅れを鑑み、複数のことを同時に進行する予定である。昨年度までに、システムの基盤などの研究を進める土台は十分に固めてあるので、最終年度である2016年度において訓練システムを確立し、その有効性を検証する。また、現在までに収集した音声認識結果をさらに詳細に分析をし、データベース間に渡る音声認識における誤認識要因の解明を行う。
|
Causes of Carryover |
2014年度は予定をしていた国際会議での発表ができなかったため、予定通りに予算を消費できないことが大きな要因となった。
|
Expenditure Plan for Carryover Budget |
2016年度は国際会議にて複数回発表し、研究成果を広く公表する予定であるとともに、論文などの投稿を増やす予定である。
|