2009 Fiscal Year Annual Research Report

聴覚障害者のコミュニケーション支援のための読唇による会話認識インタフェースの開発

Research Project

Project/Area Number	21700582
Research Institution	Tottori University
Principal Investigator	齊藤剛史 Tottori University, 工学研究科, 助教 (10379654)
Keywords	読唇システム / コミュニケーション支援 / 聴覚障害者 / インタフェース
Research Abstract	本研究課題では,機械読唇を利用した聴覚障害者のコミュニケーション支援を目的として,単音や単語だけでなく会話文をリアルタイムで認識するインタフェースの開発を目指す.本研究初年度の平成21年度は以下のことに取り組んだ. 1) 日本語25単語の発話シーンを学生10人の協力を得て撮影した.ただし,読唇をインタフェースとして利用する際,計算機性能によりカメラのフレームレートが変更する可能性がある.フレームレートが認識精度に与える影響を検討するため,撮影は一般的なカメラのフレームレートである30fpsでなく60fpsで撮影した. 2) これまでは口唇周辺が大きく写る顔下半分の発話シーンを処理対象としていた.この場合,発話時に顔が動くと口唇領域の抽出に影響を与える.この問題を避けるため,本研究課題では顔全体が写る発話シーンを対象とした.顔検出にはViolaが提案したHaar-like特徴量による顔検出など数多くの手法が提案されているが,ここでは口唇領域抽出に用いるActive Appearance Model(AAM)を顔抽出にも利用する.顔抽出後にAAMを適用し口唇領域を抽出する. 3) AAMにより五つの口唇領域を抽出し,これに基づき特徴量を定義する.特徴量として認識に有効なトラジェクトリ特徴量TFを用いるが,TFを構成する口唇領域の形状特徴量を変えて有効な特徴量の組み合わせを用いて認識実験を行なった.その結果,内側唇輪郭内領域の面積とアスペクト比,歯領域の面積を用いることにより94.6%の高い認識精度を得られることを確認した. 4) 学習用データおよび認識実験用データのフレームレートを擬似的に変更し認識実験を行なった結果,両データのフレームレートの差が小さい場合,認識率はあまり影響を受けず,認識実験用データのフレームレートを大きくする方が高い認識率が得られやすいことを確認した. 5) 研究成果は国際会議1件,国内学会2件で発表した.また国際会議および国内学会にそれぞれ1件投稿中であり,リアルタイム読唇システムに関する成果を学術論文として投稿する予定である.

Research Products
(3 results)

All 2010 2009

All Presentation (3 results)

[Presentation] トラジェクトリ特徴量を利用した単語読唇に関する基礎検討2010
- Author(s)
  齊藤剛史
- Organizer
  電子情報通信学会パターン認識・メディア理解研究会
- Place of Presentation
  鹿児島大学(鹿児島県)
- Year and Date
  20100315-20100316
[Presentation] Word Lip Reading in Various Tones2010
- Author(s)
  Takeshi Saitoh
- Organizer
  16th Korea-Japan Joint Workshop on Frontiers of Computer Vision
- Place of Presentation
  安芸グランドホテル(広島県)
- Year and Date
  20100204-20100206
[Presentation] 発話シーンからのキーフレーム検出とキーフレームに基づく単語読唇2009
- Author(s)
  森下和敏
- Organizer
  第11回画像の認識・理解シンポジウム
- Place of Presentation
  くにびきメッセ(島根県)
- Year and Date
  20090720-20090722

2009 Fiscal Year Annual Research Report

聴覚障害者のコミュニケーション支援のための読唇による会話認識インタフェースの開発

Principal Investigator

齊藤 剛史 Tottori University, 工学研究科, 助教 (10379654)

Research Products

[Presentation] トラジェクトリ特徴量を利用した単語読唇に関する基礎検討2010

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Word Lip Reading in Various Tones2010

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 発話シーンからのキーフレーム検出とキーフレームに基づく単語読唇2009

Author(s)

Organizer

Place of Presentation

Year and Date

齊藤剛史 Tottori University, 工学研究科, 助教 (10379654)