2009 Fiscal Year Annual Research Report
Project/Area Number |
21700193
|
Research Institution | Kyoto University |
Principal Investigator |
秋田 祐哉 Kyoto University, 学術情報メディアセンター, 助教 (90402742)
|
Keywords | 話し言葉 / 音声認識 / 自動整形 / モデル化 |
Research Abstract |
本研究課題では,話し言葉音声認識の応用性を高めるための本・技術として,話し言葉を可読性の高い整形文(書き言葉)に自動変換する手法の確立を目指している.平成21年度では,話し言葉表現の整形に関する統計分析,および句読点の自動挿入の検討を行った.本研究の前提となる話し言葉音声認識システムの改善もあわせて図っている. まず話し言葉表現の整形については,話し言葉と書き言葉(整形文)が対応づけられた国会音声データベースを利用して整形の分析を行った.この際,実際に整形処理が対象とする音声認識結果では認識誤りが必然的に含まれることを踏まえて,整形の実行可能性を明らかにするために整形箇所と認識の正誤との関係を定量的に調べた.音声認識には,研究代表者らが開発を進めてきた国会会議音声認識システムを利用している.この結果,整形すべき箇所での音声認識精度の特段の低下はなく,整形処理が十分に適用可能であることを確認している.国会会議音声認識システムについてはISCA Interspeech 2009(国際会議,2009年9月)にて,認識文と整形箇所の関係に関する分析については2009年日本音響学会秋季研究発表会(2009年9月)にて発表を行っている. 句読点の挿入手法については,とくに読点について取り組みを進めた.読点は個人差が見られるため,講演音声の書き起こしを対象に,読点付与の個人差・曖昧性の分析を行った.また読点自動挿入の基礎的な検討として機械学習による自動挿入法を検討した.この結果,個人差のみられない読点については比較的高い精度で挿入できることがわかった.この分析・評価については2010年日本音響学会春季研究発表会(2010年3月)にて発表を行っている.
|