2009 年度実績報告書

聴覚障害者のコミュニケーション支援のための読唇による会話認識インタフェースの開発

研究課題

研究課題/領域番号	21700582
研究機関	鳥取大学
研究代表者	齊藤剛史鳥取大学, 工学研究科, 助教 (10379654)
キーワード	読唇システム / コミュニケーション支援 / 聴覚障害者 / インタフェース
研究概要	本研究課題では,機械読唇を利用した聴覚障害者のコミュニケーション支援を目的として,単音や単語だけでなく会話文をリアルタイムで認識するインタフェースの開発を目指す.本研究初年度の平成21年度は以下のことに取り組んだ. 1) 日本語25単語の発話シーンを学生10人の協力を得て撮影した.ただし,読唇をインタフェースとして利用する際,計算機性能によりカメラのフレームレートが変更する可能性がある.フレームレートが認識精度に与える影響を検討するため,撮影は一般的なカメラのフレームレートである30fpsでなく60fpsで撮影した. 2) これまでは口唇周辺が大きく写る顔下半分の発話シーンを処理対象としていた.この場合,発話時に顔が動くと口唇領域の抽出に影響を与える.この問題を避けるため,本研究課題では顔全体が写る発話シーンを対象とした.顔検出にはViolaが提案したHaar-like特徴量による顔検出など数多くの手法が提案されているが,ここでは口唇領域抽出に用いるActive Appearance Model(AAM)を顔抽出にも利用する.顔抽出後にAAMを適用し口唇領域を抽出する. 3) AAMにより五つの口唇領域を抽出し,これに基づき特徴量を定義する.特徴量として認識に有効なトラジェクトリ特徴量TFを用いるが,TFを構成する口唇領域の形状特徴量を変えて有効な特徴量の組み合わせを用いて認識実験を行なった.その結果,内側唇輪郭内領域の面積とアスペクト比,歯領域の面積を用いることにより94.6%の高い認識精度を得られることを確認した. 4) 学習用データおよび認識実験用データのフレームレートを擬似的に変更し認識実験を行なった結果,両データのフレームレートの差が小さい場合,認識率はあまり影響を受けず,認識実験用データのフレームレートを大きくする方が高い認識率が得られやすいことを確認した. 5) 研究成果は国際会議1件,国内学会2件で発表した.また国際会議および国内学会にそれぞれ1件投稿中であり,リアルタイム読唇システムに関する成果を学術論文として投稿する予定である.

研究成果
(3件)

すべて 2010 2009

すべて学会発表 (3件)

[学会発表] トラジェクトリ特徴量を利用した単語読唇に関する基礎検討2010
- 著者名/発表者名
  齊藤剛史
- 学会等名
  電子情報通信学会パターン認識・メディア理解研究会
- 発表場所
  鹿児島大学(鹿児島県)
- 年月日
  20100315-20100316
[学会発表] Word Lip Reading in Various Tones2010
- 著者名/発表者名
  Takeshi Saitoh
- 学会等名
  16th Korea-Japan Joint Workshop on Frontiers of Computer Vision
- 発表場所
  安芸グランドホテル(広島県)
- 年月日
  20100204-20100206
[学会発表] 発話シーンからのキーフレーム検出とキーフレームに基づく単語読唇2009
- 著者名/発表者名
  森下和敏
- 学会等名
  第11回画像の認識・理解シンポジウム
- 発表場所
  くにびきメッセ(島根県)
- 年月日
  20090720-20090722

2009 年度 実績報告書

聴覚障害者のコミュニケーション支援のための読唇による会話認識インタフェースの開発

研究代表者

齊藤 剛史 鳥取大学, 工学研究科, 助教 (10379654)

研究成果

[学会発表] トラジェクトリ特徴量を利用した単語読唇に関する基礎検討2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Word Lip Reading in Various Tones2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 発話シーンからのキーフレーム検出とキーフレームに基づく単語読唇2009

著者名/発表者名

学会等名

発表場所

年月日

2009 年度実績報告書

齊藤剛史鳥取大学, 工学研究科, 助教 (10379654)