• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

視覚による表情変化の実時間認識とその読唇への応用

Research Project

Project/Area Number 06212203
Research Category

Grant-in-Aid for Scientific Research on Priority Areas

Allocation TypeSingle-year Grants
Research InstitutionThe University of Tokyo

Principal Investigator

井上 博允  東京大学, 工学部, 教授 (50111464)

Co-Investigator(Kenkyū-buntansha) 寺田 実  東京大学, 工学部, 助教授 (80163921)
Project Period (FY) 1994
Project Status Completed (Fiscal Year 1994)
Budget Amount *help
¥1,600,000 (Direct Cost: ¥1,600,000)
Fiscal Year 1994: ¥1,600,000 (Direct Cost: ¥1,600,000)
Keywords読唇 / 画像認識 / 音声認識 / テンプレートマッチング / 相関値 / 平面配置 / 並列処理 / ニューラルネットワーク
Research Abstract

本年度の研究では,昨年度まで行なってきた相関値による顔の確認の応用として,読唇を行なった.
処理の原理は,相関値を用いて個々の入力画像を平面上にマッピングし,その(x,y)座標値をニューラルネットの入力として用いて判別を行なった.
昨年度の実験から,母音の認識は可能であるとの結果を得ていたが,本年度は,いくつかの子音(b,m,p)の認識と,さらに実時間(ビデオレート)の認識に成功した.実時間化にあたっては,トランスピュータ4台による並列処理を行ない,画像追跡,相関計算,平面配置処理をパイプライン化することで,達成できた.平面配置計算はその内部に反復計算を含むが,より初期値を与えることでその反復回数を大幅に削減できる.処理の高速化によって,口唇の動きを連続的に把握できるようになったため,前回の配置結果を次の初期値とすることで,さらなる高速化が可能になった.また,テンプレートを平面配置した結果として,相互の関係が明らかになるため,類似したテンプレートをはぶくことで,相関値計算も高速化できた.
認識精度については,話者や照明条件への依存性が高いものの,母音だけであれば80%程度,子音ひとつを含んだ場合には60%程度の成績を得ている.
3年間の研究によって,表情や口唇など不定型な対象の認識に対しては,テンプレートマッチングを拡張した相関値による配置方式が有力となることが示せたと考えている.

Report

(1 results)
  • 1994 Annual Research Report
  • Research Products

    (1 results)

All Other

All Publications (1 results)

  • [Publications] 渡辺英之,寺田実,井上博允: "相関値による読唇" 第3回顔のワークショップ資料. 15-20 (1994)

    • Related Report
      1994 Annual Research Report

URL: 

Published: 1994-04-01   Modified: 2018-06-07  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi