audio-visual speech recognition for robots
Project/Area Number |
19700158
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
Perception information processing/Intelligent robotics
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
NAKADAI Kazuhiro Tokyo Institute of Technology, 大学院・情報理工学研究科, 客員准教授 (70436715)
|
Project Period (FY) |
2007 – 2008
|
Project Status |
Completed (Fiscal Year 2008)
|
Budget Amount *help |
¥3,480,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥180,000)
Fiscal Year 2008: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2007: ¥2,700,000 (Direct Cost: ¥2,700,000)
|
Keywords | ロボット聴覚 / 音声認識 / 音楽認識 / 発話区間検出 / 音楽館検出 / 視聴覚統合 / ミッシングフィーチャ理論 / Coarse-to-Fine認識 / 音楽区間検出 |
Research Abstract |
本研究では、実環境でのロボット音声認識を向上させるため、リップリーディングを用いた視聴覚統合、低信頼度の視聴覚情報でも最適な統合を実現するミッシングフィーチャ理論、認識単位を動的に変更するCoarse-to-Fine認識を用いた。この結果、最大50ポイント単語正解率を向上できることを示した。また、研究の過程で得られた課題に対応するため、計画変更を行い、対雑音頑健性および変化への即応性を両立したビートトラッキング手法を開発し、これを用いて歌って踊るロボットを開発した。以上の成果に対して国内外で計4件の賞を受けた。
|
Report
(3 results)
Research Products
(28 results)