2005 Fiscal Year Annual Research Report
大規模ジェスチャー認識のための基本動作モデル生成の研究
Project/Area Number |
15500107
|
Research Institution | NAGOYA INSTITUTE OF TECHNOLOGY |
Principal Investigator |
北村 正 名古屋工業大学, 工学研究科, 教授 (60114865)
|
Co-Investigator(Kenkyū-buntansha) |
徳田 恵一 名古屋工業大学, 工学研究科, 教授 (20217483)
後藤 富朗 名古屋工業大学, 工学研究科, 助手 (20324478)
|
Keywords | 隠れマルコフモデル / 日本手話 / 統合法 / アクティブ探索法 / RWCPデータベース / 基本動作 / コンテキストクラスタリング |
Research Abstract |
今年度は、手話の手座標・形状情報の統合に基づく認識法の検討、アクティブ画像探索法に基づく手の高速追跡法、基本動作モデルの検討を行った。以下にそれぞれについて述べる。 1.国立身体障害者リハビリテーションセンター研究所開発の日本手話データーベース(DB)を利用した。当該DBの中から動作数の多い手話動作者、出現頻度の高い18単語を選び学習・認識の対象とした。手話の特徴パラメータとして、手の動作と形状情報を利用しているが,それらを統合する方法(初期統合法、結果統合法)を検討した。動作:形状に7:3の重み付けをした統合により、形状情報単独に比べて誤り改善率が12.5%と向上し、82.8%の単語認識率が得られ、その有効性が示された。手話単語モデル作成には隠れマルコフモデルを用いている。 2.手の座標抽出の実時間処理を目指して、アクティブ画像探索法に基づく方法を検討した。提案法は、過去の手座標から現在の探索範囲を予測し、探索範囲内の動作領域と肌色領域の情報から手座標を高速抽出する方法である。RWCPの手話単語DBに対して、肌色情報のベクトル量子化に基づき手の座標を抽出する従来法と比較を行い、4倍高速に抽出可能であることを確認した。 3.前後の基本動作情報に基づくコンテキストクラスタリングを用いる基本動作モデル学習法を提案した。RWCPの手話単語DBを用いたが、まず手話単語を基本動作のラベル付けを行い、コンテキストクラスタリングに基づいて基本動作モデルを作成し、更に連結学習により各モデルを再学習する。得られた基本動作モデルの接続により任意の単語モデルを作成する。研究では、33単語モデルの認識実験を学習データに対して行ったが、約93%の認識率が得られ、提案法の有効性が確認できた。今後は,テストデータに対して有効性を検討していく予定である。
|