本研究では、単語レベルで学習された多数のHMMを用い、各HMMの状態パラメータの分類から手話問の共通要素を集約する新たな手法と、個人差などによる手話動作の差異に頑健に対応する手話認識手法を提案した。その際、手話では手の位置、運動、局所情報という性質の異なる要素の同時的な組合せから多様な動作を表す、手話の音韻構造に着目し、これらの音韻要素と両手の独立性を考え、個別に学習・分類することで効率的に共通要素の集約がより効率化される。これにより単語全体のモデルパラメータ数削減と、それに伴う相対的な学習データ数の増加が見込まれる。RWC手話データベースを用いた単語認識実験では、本提案によるサブユニットの導入と音韻構造を考慮することにより、我々の手法が手話単語認識精度の改善に寄与することが確認された。
|