2010 Fiscal Year Annual Research Report
複数認識器の統合による音声及び画像の協調理解とマルチモーダル対話システムへの応用
Project/Area Number |
21500143
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
遠藤 勉 九州工業大学, 大学院・情報工学研究院, 教授 (10112294)
|
Co-Investigator(Kenkyū-buntansha) |
嶋田 和孝 九州工業大学, 大学院・情報工学研究院, 助教 (50346863)
|
Keywords | 音声理解 / 複合認識器 / 人物識別 / 頭上画像 |
Research Abstract |
・階層型複合音声認識器による発話理解 対象とするドメインのトピックごとに作成した複数の音声認識器を階層化し,統合利用する手法について提案し,実験の結果,認識精度の向上を確認した.トピック外発話に対して,制約のない大規模認識器とドメインに依存した中規模認識器を併用することで,トピック推定の精度向上を図った ・場の文脈情報を利用した人物属性の推定 人物を識別する際に,顔の情報だけでなく,場のもつ文脈として衣服情報を利用する識別手法を提案し,評価した.特徴量としてHOG (Histograms of Oriented Gradients)を新たに追加し,有効性検証を行った また,より柔軟な人物識別を可能とするために,頭上方向からの画像を対象とした人物識別手法について提案し,評価した.頭上方向からの画像による人物識別では,識別精度を向上させる手段として,対象者が持っているバッグの種類を推定する手法についても提案し,評価した
|
Research Products
(5 results)