研究課題/領域番号 |
21300062
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知覚情報処理・知能ロボティクス
|
研究機関 | 東京工業大学 |
研究代表者 |
古井 貞煕 (古井 貞熙) 東京工業大学, 名誉教授 (90293076)
|
研究分担者 |
篠田 浩一 東京工業大学, 大学院・情報理工学研究科, 准教授 (10343097)
篠崎 隆宏 千葉大学, 大学院・融合科学研究科, 助教 (80447903)
|
研究期間 (年度) |
2009 – 2011
|
研究課題ステータス |
完了 (2011年度)
|
配分額 *注記 |
18,070千円 (直接経費: 13,900千円、間接経費: 4,170千円)
2011年度: 3,770千円 (直接経費: 2,900千円、間接経費: 870千円)
2010年度: 6,760千円 (直接経費: 5,200千円、間接経費: 1,560千円)
2009年度: 7,540千円 (直接経費: 5,800千円、間接経費: 1,740千円)
|
キーワード | 音声情報処理 / 音声認識 / WFST / デコーダ |
研究概要 |
重みつき有限状態トランスデューサ(WFST)による音声認識の高度化と、WFSTデコーダの新たな応用展開を目指して研究を行い、以下の種々の成果を上げることができた。WFSTデコーダのon-the-fly合成アルゴリズムの改良を行い、世界最高性能の音声認識デコーダ(T^3デコーダ)を開発した。これにさらに音声・非音声情報を組み込み、雑音下での認識性能を向上させた。開発したデコーダを、大規模コーパスを持たない音声や、複数言語が混在して用いられる音声の認識、transliterationなどに適用し、効果的なアルゴリズムを提案した。さらに、デコーダ技術の新たな展開となるアイディアを創出した。開発したT^3デコーダを、国内外に公開した。
|