2011 Fiscal Year Annual Research Report
自然な発話による音声インタラクションのための言語モデルに関する研究
Project/Area Number |
11J07766
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
太田 健吾 豊橋技術科学大学, 大学院・工学研究科, 特別研究員(DC2)
|
Keywords | 音声認識 / 言語モデル / 音響モデル / 話し言葉 |
Research Abstract |
本年度は,話し言葉特有の言い回しを考慮した音声認識用言語モデルを構築する方法について検討してきた.話し言葉を対象とした音声認識用言語モデルを構築するためには,対象音声とドメインが一致し,かつ,話し言葉特有の言い回しが忠実に書き起こされた大規模な話し言葉コーパス(テキストデータベース)から言語モデルを学習するという方法が一般的である.しかし,話し言葉を正確に書き起こす作業は極めて高いコストを必要とするため,あらゆるドメインに対して,そのようなコーパスが入手できると仮定することは現実的ではない.それに対して,速記録や会議録は,正確な書き起こしより広く作成されており,比較的容易に入手が可能である.ただし,速記録や会議録では,可読性を高めるために,間投詞や言い淀み,言い直しなどの話し言葉特有の現象は削除され,話し言葉特有の言い回しは適切な書き言葉に置き換えられるなど,様々な整形処理がなされていることが一般的である. このような背景を踏まえて,本研究では,速記録や会議録(整形された書き起こし)を正確な書き起こしに半自動的に変換する枠組みの構築について検討してきた.この枠組みでは,まず整形された書き起こし中の整形箇所を自動検出し,検出された整形箇所のみを人手で書き起こすことにより,できるだけ小さいコストで,整形された書き起こしと正確な書き起こしのパラレルコーパスを作成する. 本研究で提案した整形箇所の自動検出手法を,国会会議録を用いた評価実験によって評価した結果,実用的な検出精度を達成することができた.さらに,提案法を用いて検出された非整形箇所は,音声認識用音響モデルの話者適応用データとして有効であることを示した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
整形された書き起こしと正確な書き起こしのパラレルコーパスを効率的に構築するために,整形された書き起こしから整形箇所を自動検出する方法を提案し,実際の国会会議録を用いた評価実験において実用的な検出精度が達成できた.さらに,本提案手法は,音声認識用音響モデルの話者適応にも応用できることを示した.よって,おおむね順調に進展しているといえる.
|
Strategy for Future Research Activity |
今後は,まず,これまでに提案した手法に基づいて,整形された書き起こしと正確な書き起こしの大規模なパラレルコーパスを集積する.次に,このパラレルコーパスに基づいて,大規模な書き言葉コーパスから話し言葉特有の言い回しを考慮した音声認識用言語モデルを構築し,この言語モデルを,音声認識実験によって評価する.
|
Research Products
(3 results)